基于机器学习的客服语音智能质检系统的设计与实现

发布时间：2022-12-04 23:05

　　客服语音质检是热线服务运营中一个非常重要的质量控制环节。传统的客服语音质检系统通过人工对照考核标准表听取录音,主要以抽检方式进行,质检效率低且覆盖面小,本文设计与实现了客服语音智能质检系统,利用机器学习中的卷积神经网络CNN（Convolutional Neural Network）模型,计算文本相似度,求出偏差率,进行质检评分,自动化程度高,覆盖面广,大大提高了质检的精确度。本文分析现有的客服语音质检的现状,对河北斯博思创新科技有限公司客服部语音文本数据进行深入研究,通过需求分析,设计总体框架,实现了基于机器学习的客服语音智能质检系统,主要的研究内容如下:（1）数据的获取。数据来源于河北斯博思创新科技有限公司历年客服语音数据。（2）数据的预处理。首先对获取的原始文本进行数据清洗,利用Hanlp分词工具进行中文分词、去停用词。（3）模型的选择。提出两种文本相似度模型,一种是基于文档向量的文本相似度模型,另一种是基于CNN的文本相似度模型,利用公司历年客服数据作为数据集,计算两种模型文本相似度,结合质检标准分别求取偏差率,基于CNN文本相似度模型的偏差率介于0.05-0.06,基于文档向...

【文章页数】：78 页

【学位级别】：硕士

【文章目录】：
中文摘要
英文摘要
1 绪论
    1.1 研究背景、目的及意义
    1.2 国内外研究现状
        1.2.1 国内研究现状
        1.2.2 国外研究现状
    1.3 主要的研究内容与方法
    1.4 论文组织架构
2 相关技术
    2.1 自然语言处理技术
        2.1.1 自然语言处理理论基础
        2.1.2 中文分词理论基础
    2.2 关键词提取技术
    2.3 词嵌入语义向量与语义距离
    2.4 文本相似度技术
        2.4.1 文本相似度理论基础
        2.4.2 词袋向量
3 语义分析算法的研究与质检评分模型的构建
    3.1 数据预处理
        3.1.1 中文分词
        3.1.2 去停用词
    3.2 关键词提取
    3.3 关键句提取
    3.4 基于Word2Vec算法的词向量建立
        3.4.1 Word2Vec算法的模型选取
        3.4.2 Word2Vec算法的词向量表示
        3.4.3 算法实现
    3.5 文本相似度的计算
        3.5.1 基于文档向量的文本相似度计算
        3.5.2 算法实现
        3.5.3 基于CNN的文本相似度计算
        3.5.4 算法实现
        3.5.5 偏差率的计算
4 基于机器学习的客服语音智能质检系统的需求分析与设计
    4.1 需求分析
    4.2 系统总体设计
        4.2.1 系统设计准则
        4.2.2 功能模块设计
    4.3 数据库设计
        4.3.1 用户表结构设计
        4.3.2 质检规则表结构设计
        4.3.3 质检报告表结构设计
    4.4 本章小结
5 基于机器学习的客服语音智能质检系统的实现
    5.1 用户登录模块的实现
    5.2 主界面的实现
    5.3 自动质检评分的实现
    5.4 管理员功能模块的实现
    5.5 语音信箱管理界面的实现
    5.6 本章小结
6 系统测试
    6.1 测试目的
    6.2 系统功能测试
        6.2.1 用户登录模块测试
        6.2.2 文本相似度计算测试
        6.2.3 自动化质检模块的测试
    6.3 本章小结
7 总结与展望
    7.1 总结
    7.2 展望
参考文献
致谢

【参考文献】：
期刊论文
[1]2019年美国《麻省理工科技评论》发布“全球十大突破性技术”（上篇）[J]. 陈醒.  国际融资. 2020(01)
[2]结合语义相似度改进LDA的文本主题分析[J]. 赵林静.  计算机工程与设计. 2019(12)
[3]基于Log-Euclidean词袋模型与基于Stein核稀疏编码的人体行为识别算法的优化与改进[J]. 杨丰嘉.  科技创新与应用. 2019(35)
[4]基于词向量语义扩展的网络文本特征选择方法研究[J]. 吕建新,郑伟,马林,李明,谷翠梅.  情报科学. 2019(12)
[5]基于融合共现距离的句法网络下文本语义相似度计算[J]. 严娇,马静,房康.  数据分析与知识发现. 2019(12)
[6]基于深度学习和迁移学习的领域自适应中文分词[J]. 成于思,施云涛.  中文信息学报. 2019(09)
[7]基于时空切分和词向量相似性的轨迹伴随模式挖掘[J]. 李欣.  中山大学学报(自然科学版). 2019(05)
[8]基于深度学习的文本相似度计算[J]. 邵恒,冯兴乐,包芬.  郑州大学学报(理学版). 2020(01)
[9]自然语言处理领域中的自动问答研究进展[J]. 郭天翼,彭敏,伊穆兰,毛文月,胡星灿,魏格格.  武汉大学学报(理学版). 2019(05)
[10]MGSC:一种多粒度语义交叉的短文本语义匹配模型[J]. 吴少洪,彭敦陆,苑威威,陈章,刘丛.  小型微型计算机系统. 2019(06)

硕士论文
[1]基于深度学习的中文分词算法研究[D]. 赵恒淼.山东科技大学 2018

本文编号：3709163

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3709163.html

上一篇：基于集群的海量MOST图像快速预处理研究
下一篇：面向自然场景汉字识别的非平衡性与抗攻击性研究