当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于自适应标签抽取的客服微博自动应答系统

发布时间:2017-05-15 04:08

  本文关键词:基于自适应标签抽取的客服微博自动应答系统,由笔耕文化传播整理发布。


【摘要】:随着计算机网络的发展,在线搜索已经成为一种快速获取信息的新途径。用户越来越希望能够快速地获得自己想要的答案,然而搜索引擎以网页列表的形式返回搜索结果,需要用户从中去找到答案,这在一定程度上降低了搜索效率,用户体验也受到一定的影响。自动应答系统弥补了搜索引擎的不足,直接返回准确、简洁的答案给用户,并且允许用户以自然语言的方式提问,提高了用户查询的便捷性。自动应答系统应用范围广泛,是自然语言处理领域里非常重要的研究方向。 本文对自动应答系统中的关键技术进行了研究与改进,并取得了一些研究成果,主要工作包括以下几个方面: (1)提出了利用Canopy聚类算法与LDA主题模型相结合的方法,实现了对文本集的聚类操作。 (2)结合词向量得到词语之间的语义信息,提出了改进的Text Rank标签抽取算法。 (3)实现了文本聚类技术与标签抽取技术相结合的标签自适应抽取功能。 (4)结合新浪微博上用户与企业客服的问答特点,设计与实现了基于自适应标签抽取的客服微博自动应答系统。 通过实验证明,改进的LDA文本聚类方法缩短了文本集的训练时间,提高了文本聚类的整体效果;基于语义信息的Text Rank标签抽取算法要优于其它传统的标签抽取算法。 经过系统测试,本文所构建的基于自适应标签抽取的客服微博自动应答系统易用性强,系统准确率达到70%以上,响应时间小于1秒,基本满足用户需求,能够帮助企业高效的完成客服工作。
【关键词】:自动应答系统 文本聚类 标签抽取 信息查询
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3;TP391.1
【目录】:
  • 摘要4-5
  • ABSTRACT5-7
  • 目录7-9
  • 第一章 绪论9-14
  • 1.1 课题研究背景及意义9
  • 1.2 自动应答系统的国内外研究现状9-10
  • 1.3 客服微博自动应答系统的特点10-12
  • 1.4 论文主要研究内容及创新点12
  • 1.5 论文的组织内容12-14
  • 第二章 自动应答系统的关键技术14-25
  • 2.1 自动应答系统的结构14-15
  • 2.2 查询分析模块15-17
  • 2.3 文档库建模模块17-24
  • 2.3.1 文本聚类算法18-23
  • 2.3.2 标签抽取算法23-24
  • 2.4 信息检索模块24
  • 2.5 本章小结24-25
  • 第三章 改进的LDA文本聚类方法25-37
  • 3.1 聚类算法的选择25-27
  • 3.1.1 LDA主题模型25-26
  • 3.1.2 LDA主题模型的不足26-27
  • 3.2 改进的基于Canopy算法文本聚类方法27-30
  • 3.2.1 Canopy聚类算法27-28
  • 3.2.2 基于Canopy算法的LDA聚类算法28-30
  • 3.3 评价指标30-31
  • 3.4 实验结果与分析31-36
  • 3.4.1 实验数据集31-32
  • 3.4.2 结果对比分析32-36
  • 3.5 本章小结36-37
  • 第四章 基于语义信息的Text Rank标签抽取算法37-48
  • 4.1 Text Rank标签抽取算法37-40
  • 4.1.1 Page Rank算法37-38
  • 4.1.2 Text Rank标签抽取算法38-40
  • 4.2 改进的Text Rank标签抽取算法40-45
  • 4.2.1 基于词向量的语义信息表示40-43
  • 4.2.2 改进的基于语义信息的Text Rank标签抽取算法43-45
  • 4.3 评价指标45
  • 4.4 实验对比及分析45-47
  • 4.4.1 实验数据集46
  • 4.4.2 结果对比分析46-47
  • 4.5 本章小结47-48
  • 第五章 系统设计与实现48-55
  • 5.1 系统整体架构设计48-49
  • 5.2 系统子模块设计与实现49-52
  • 5.2.1 查询分析模块49-50
  • 5.2.2 文档库建模模块50-51
  • 5.2.3 信息检索模块51-52
  • 5.2.4 客服管理模块52
  • 5.3 系统整体性能测试52-54
  • 5.4 本章小结54-55
  • 第六章 结论与展望55-57
  • 6.1 全文总结55-56
  • 6.2 下一步工作的展望56-57
  • 参考文献57-60
  • 致谢60

【参考文献】

中国期刊全文数据库 前7条

1 樊孝忠,李宏乔,李良富,叶江;银行领域汉语自动问答系统BAQS的研究与实现[J];北京理工大学学报;2004年06期

2 王树西,刘群,白硕;一个人物关系问答的专家系统[J];广西师范大学学报(自然科学版);2003年01期

3 郑家恒,卢娇丽;关键词抽取方法的研究[J];计算机工程;2005年18期

4 黄寅飞,郑方,燕鹏举,徐明星,吴文虎;校园导航系统Easy Nav的设计与实现[J];中文信息学报;2001年04期

5 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期

6 岑咏华;王晓蓉;吉雍慧;;一种基于改进K-means的文档聚类算法的实现研究[J];现代图书情报技术;2008年12期

7 ;A Distributed Dynamic Clustering Algorithm for Wireless Sensor Networks[J];Wuhan University Journal of Natural Sciences;2008年02期


  本文关键词:基于自适应标签抽取的客服微博自动应答系统,,由笔耕文化传播整理发布。



本文编号:366849

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/366849.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1df45***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com