基于深度学习的音乐信息检索算法研究

发布时间：2024-03-17 03:33

　　网络多媒体音频数量与日俱增,如何能够高效地检索出所需目标,现已成为音乐信息检索技术的一个关键性问题,歌曲匹配作为音乐信息检索的一个子任务,也越来越受到人们的重视,近年来,深度学习方法的兴起促进了人工智能的发展,也为音乐检索提供了一个新的思路。深度学习技术在语音信号处理等领域取得了一系列成功。本文借鉴深度学习在语音信号处理方面的研究成果,在音乐信息检索与深度学习理论相结合的基础之上针对如何更好的利用深度学习来研究更加适用于音乐信息检索这一问题的方法主要研究内容有:1.提取了 WAVE音乐库中标准的音高信息。在综合考虑算法精度与时间复杂度后本文采用了新的方法BP神经网络对音乐信号音符切分及清浊音区分,在此基础上使用倒谱分析进行基音周期的估计。2.建立了以音符为基础的HMM模型,进行了模型训练与识别,通过HMM算法实现了音乐信息的检索。3.在限制玻尔兹曼机的基础上介绍了卷积深度置信网络模型,并将卷积深度置信网络算法应用到音乐信息检索中。首先通过非监督贪婪逐层算法进行了预训练,然后,通过有监督的网络训练方法对网络参数进行了微调,通过调整网络参数提高了模型的识别能力。通过实验得出歌曲样本长度为3...

【文章页数】：66 页

【学位级别】：硕士

【部分图文】：

图２．１分帧图??Ｆｉｇ．?２．１?Ｔｈｅ?ｄｉａｇｒａｍ?ｏｆ?ｆｒａｍｅ??

以是交叠的，也可以是连续的，两个相邻帧之间可以有交叠，重叠的这一部分??我们称之为帧移。帧移长度一般会取帧长的１／３到１／２，这个取值具体要看实际??应用。分帧中帧长和帧移如图２．１。分帧一般与加窗［４６］—起使用。对于每一帧数??据，帧长取Ｎ，然后将窗函数与原来的输入信号彳《）....

图２．２端点检测流程??Ｆｉｇ．?２．２?Ｔｈｅ?ｐｒｏｃｅｓｓ?ｏｆ?ｅｎｄｐｏｉｎｔ?ｄｅｔｅｃｔｉｏｎ??

过了高门限，就能确信进入语音段。处于语音段时，若两个参数的数值降低到??了低门限以下，而且总的计时长度小于最短时间门限，则是一段噪音，然后扫??描以后的语音数据。否则，标记好结束端点，并返回。图２．２所示为端点检测流??程图：??设置各初始值????计算短義量、?Ｎ???调雜１丨....

图２．４人工神经元模型??Ｆｉ．?２．４?Ａｒｔｉｆｉｃｉａｌ?ｎｅｕｒａｌ?ｍｏｄｅｌ??

?音频特征提取??图２．３是一段哼唱歌曲的短时能量与过零率结果图??Ｗａｖｅ?ｆｏｒｍ??１?ｉ?Ｉ?？?ｉ?ｉ?ｉ?ｒ??■ｇ??｜?０?一?卜＿?■丨?ｎ?￣￣＾一????＜??１?Ｉ?Ｉ?Ｉ????ｉ???ｉ?ｉ??０．５?１?１．５?２?２．５??Ｓｈｏｒｔ－ｔｉｍｅ?ｅ....

图２．３短时能量与过零率结果图??Ｆｉｇ．?２．３?Ｔｈｅ?ｒｅｓｕｌｔ?ｄｉａｇｒａｍ?ｏｆ?ｓｈｏｒｔ－ｔｉｍｅ?ｅｎｅｒｇｙ?ａｎｄ?ｚｅｒｏ?ｃｒｏｓｓｉｎｇ?ｒａｔｅ??

?音频特征提取??图２．３是一段哼唱歌曲的短时能量与过零率结果图??Ｗａｖｅ?ｆｏｒｍ??１?ｉ?Ｉ?？?ｉ?ｉ?ｉ?ｒ??■ｇ??｜?０?一?卜＿?■丨?ｎ?￣￣＾一????＜??１?Ｉ?Ｉ?Ｉ????ｉ???ｉ?ｉ??０．５?１?１．５?２?２．５??Ｓｈｏｒｔ－ｔｉｍｅ?ｅ....

本文编号：3930448

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3930448.html

上一篇：4SRRR足式爬壁机器人设计与分析
下一篇：大鼠机器人转向及探嗅行为控制与机制研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|