当前位置:主页 > 科技论文 > 信息工程论文 >

基于条件深度卷积生成对抗网络的语音增强模型研究

发布时间:2024-02-14 20:27
  语音交互技术在现实生活中得到了广泛的应用,比如自动语音识别系统、智能家居、移动语音通信,但由于干扰的存在,现实环境中语音交互技术远没有达到令人满意的程度,语音增强技术是提高语音交互性能的有效途径。本文在阐述了语音增强的相关背景和研究现状后,针对语音和噪声的特征,提出了一种基于条件深度卷积生成对抗网络(C-DCGAN)语音增强模型,C-DCGAN模型是在生成对抗网络(GAN)的基础上加入卷积层和条件信息。C-DCGAN利用生成器中的卷积层自动提取语音特征,利用提取的特征生成语音样本。然后将生成的语音样本和纯净的语音样本同时输入到判别器中,判别器判断生成的语音样本为真或者假。最后通过反向传播训练网络模型,使生成器生成尽量接近纯净语音的语音样本,同时使判别器能判别真实的样本和生成的样本。C-DCGAN模型通过对抗博弈的方法进行训练,在对抗博弈中,生成器获得了语音信号的隐含特征,从而可利用提出的模型输出接近纯净语音的语音信号。在模型训练完成后,将混合语音输入到模型中,生成增强后的语音,从而实现对带噪语音的语音增强。为了评估C-DCGAN模型的性能,本文搭建了基于Tensorflow的语音增强平...

【文章页数】:53 页

【学位级别】:硕士

【部分图文】:

图1-1语音增强的应用领域

图1-1语音增强的应用领域

第一章绪论机对话、智能家居中的应用越来越多[15],发挥着巨大的作用,语音增强在现实生活中应用如图1-1所示。因此,语音增强对提高现有语音处理系统的性能具有重要意义,时,语音增强作为人工智能中的关键技术,具有重要的现实意义。(a)语音识别(b)助听器


图1-2本文提出的语音增强模型

图1-2本文提出的语音增强模型

图1-2本文提出的语音增强模型Fig.1-2TheProposedSpeechEnhancementofThisPaperC-DCGAN模型的工作原理如图1-3所示。首先,通过标准语音数据集和噪声集在多种信噪比下构造混合语音数据集,然后,在GAN的基....


图1-3C-DCGAN模型原理

图1-3C-DCGAN模型原理

图1-2本文提出的语音增强模型Fig.1-2TheProposedSpeechEnhancementofThisPaperC-DCGAN模型的工作原理如图1-3所示。首先,通过标准语音数据集和噪声集在多种信噪比下构造混合语音数据集,然后,在GAN的基....


图2-1基本谱减法原理

图2-1基本谱减法原理

许多研究者正在研究其机理并将其应用到语音增强中。2.4语音增强方法在语音增强的研究发展过程中,出现了各种不同的语音增强算法,每种算法都有其优缺点。本小节主要介绍基于谱减法、维纳滤波法、最小均方误差以及深度神经网络的语音增强方法。2.4.1谱减法谱减法由Boll在1979....



本文编号:3898568

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3898568.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户4ddc3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com