当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的音乐信息检索算法研究

发布时间:2024-03-17 03:33
  网络多媒体音频数量与日俱增,如何能够高效地检索出所需目标,现已成为音乐信息检索技术的一个关键性问题,歌曲匹配作为音乐信息检索的一个子任务,也越来越受到人们的重视,近年来,深度学习方法的兴起促进了人工智能的发展,也为音乐检索提供了一个新的思路。深度学习技术在语音信号处理等领域取得了一系列成功。本文借鉴深度学习在语音信号处理方面的研究成果,在音乐信息检索与深度学习理论相结合的基础之上针对如何更好的利用深度学习来研究更加适用于音乐信息检索这一问题的方法主要研究内容有:1.提取了 WAVE音乐库中标准的音高信息。在综合考虑算法精度与时间复杂度后本文采用了新的方法BP神经网络对音乐信号音符切分及清浊音区分,在此基础上使用倒谱分析进行基音周期的估计。2.建立了以音符为基础的HMM模型,进行了模型训练与识别,通过HMM算法实现了音乐信息的检索。3.在限制玻尔兹曼机的基础上介绍了卷积深度置信网络模型,并将卷积深度置信网络算法应用到音乐信息检索中。首先通过非监督贪婪逐层算法进行了预训练,然后,通过有监督的网络训练方法对网络参数进行了微调,通过调整网络参数提高了模型的识别能力。通过实验得出歌曲样本长度为3...

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

图2.1分帧图??Fig.?2.1?The?diagram?of?frame??

图2.1分帧图??Fig.?2.1?The?diagram?of?frame??

以是交叠的,也可以是连续的,两个相邻帧之间可以有交叠,重叠的这一部分??我们称之为帧移。帧移长度一般会取帧长的1/3到1/2,这个取值具体要看实际??应用。分帧中帧长和帧移如图2.1。分帧一般与加窗[46]—起使用。对于每一帧数??据,帧长取N,然后将窗函数与原来的输入信号彳《)....


图2.2端点检测流程??Fig.?2.2?The?process?of?endpoint?detection??

图2.2端点检测流程??Fig.?2.2?The?process?of?endpoint?detection??

过了高门限,就能确信进入语音段。处于语音段时,若两个参数的数值降低到??了低门限以下,而且总的计时长度小于最短时间门限,则是一段噪音,然后扫??描以后的语音数据。否则,标记好结束端点,并返回。图2.2所示为端点检测流??程图:??设置各初始值????计算短義量、?N???调雜1丨....


图2.4人工神经元模型??Fi.?2.4?Artificial?neural?model??

图2.4人工神经元模型??Fi.?2.4?Artificial?neural?model??

?音频特征提取??图2.3是一段哼唱歌曲的短时能量与过零率结果图??Wave?form??1?i?I???i?i?i?r??■g??|?0?一?卜_?■丨?n? ̄ ̄^一????<??1?I?I?I????i???i?i??0.5?1?1.5?2?2.5??Short-time?e....


图2.3短时能量与过零率结果图??Fig.?2.3?The?result?diagram?of?short-time?energy?and?zero?crossing?rate??

图2.3短时能量与过零率结果图??Fig.?2.3?The?result?diagram?of?short-time?energy?and?zero?crossing?rate??

?音频特征提取??图2.3是一段哼唱歌曲的短时能量与过零率结果图??Wave?form??1?i?I???i?i?i?r??■g??|?0?一?卜_?■丨?n? ̄ ̄^一????<??1?I?I?I????i???i?i??0.5?1?1.5?2?2.5??Short-time?e....



本文编号:3930448

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3930448.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户6be10***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com