基于条件深度卷积生成对抗网络的语音增强模型研究

发布时间：2024-02-14 20:27

　　语音交互技术在现实生活中得到了广泛的应用,比如自动语音识别系统、智能家居、移动语音通信,但由于干扰的存在,现实环境中语音交互技术远没有达到令人满意的程度,语音增强技术是提高语音交互性能的有效途径。本文在阐述了语音增强的相关背景和研究现状后,针对语音和噪声的特征,提出了一种基于条件深度卷积生成对抗网络(C-DCGAN)语音增强模型,C-DCGAN模型是在生成对抗网络(GAN)的基础上加入卷积层和条件信息。C-DCGAN利用生成器中的卷积层自动提取语音特征,利用提取的特征生成语音样本。然后将生成的语音样本和纯净的语音样本同时输入到判别器中,判别器判断生成的语音样本为真或者假。最后通过反向传播训练网络模型,使生成器生成尽量接近纯净语音的语音样本,同时使判别器能判别真实的样本和生成的样本。C-DCGAN模型通过对抗博弈的方法进行训练,在对抗博弈中,生成器获得了语音信号的隐含特征,从而可利用提出的模型输出接近纯净语音的语音信号。在模型训练完成后,将混合语音输入到模型中,生成增强后的语音,从而实现对带噪语音的语音增强。为了评估C-DCGAN模型的性能,本文搭建了基于Tensorflow的语音增强平...

【文章页数】：53 页

【学位级别】：硕士

【部分图文】：

图1-1语音增强的应用领域

第一章绪论机对话、智能家居中的应用越来越多[15]，发挥着巨大的作用，语音增强在现实生活中应用如图1-1所示。因此，语音增强对提高现有语音处理系统的性能具有重要意义，时，语音增强作为人工智能中的关键技术，具有重要的现实意义。（a）语音识别（b）助听器

图1-2本文提出的语音增强模型

图1-2本文提出的语音增强模型Fig.1-2TheProposedSpeechEnhancementofThisPaperC-DCGAN模型的工作原理如图1-3所示。首先，通过标准语音数据集和噪声集在多种信噪比下构造混合语音数据集，然后，在GAN的基....

图1-3C-DCGAN模型原理

图1-2本文提出的语音增强模型Fig.1-2TheProposedSpeechEnhancementofThisPaperC-DCGAN模型的工作原理如图1-3所示。首先，通过标准语音数据集和噪声集在多种信噪比下构造混合语音数据集，然后，在GAN的基....

图2-1基本谱减法原理

许多研究者正在研究其机理并将其应用到语音增强中。2.4语音增强方法在语音增强的研究发展过程中，出现了各种不同的语音增强算法，每种算法都有其优缺点。本小节主要介绍基于谱减法、维纳滤波法、最小均方误差以及深度神经网络的语音增强方法。2.4.1谱减法谱减法由Boll在1979....

本文编号：3898568

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3898568.html

上一篇：5G及5G后无线通信系统中的非平稳信道建模研究
下一篇：中短程捷联惯导/GNSS导航系统关键技术研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|