当前位置:主页 > 经济论文 > 工业经济论文 >

基于BERT的在线评论隐性特征识别方法研究

发布时间:2024-02-03 12:42
  随着互联网技术的蓬勃发展,电商平台在人们生产生活中越来越重要,同时也成为我国经济体系中十分重要的一部分。尤其在2020年上半年面对新冠疫情的严峻挑战时,商品消费明显由线下向线上转移。顾客和商家对产品和服务的线上评价反馈愈发重视,然而海量评论让人难以找到对自己有用的信息,在此背景下观点挖掘技术应运而生。传统的文档和句子级别的观点挖掘只能获得产品和服务在整体上的优劣,无法获取方面或者属性级别的评价信息,难以满足顾客和商家对于更加细粒度的观点信息需求。因此,特征级别的观点挖掘分析,即细粒度观点挖掘脱颖而出,成为近年来学术界和工业界的研究热点之一。特征级别观点挖掘,也称作方面或属性级别观点挖掘,是对评价对象的不同特征进行观点挖掘和情感倾向分析。观点内容提取和评论特征识别是特征级别挖掘任务的两个子任务,通过在评论文本中获取特征级别的观点内容,再判断该观点评价的特征,达到识别出特征级别观点信息的目的。面对评论中通常包含多个特征方面观点时,从评论中获取特征级别观点内容是观点挖掘的首要任务。有效的提高观点识别的准确性和自动化程度,更有助于特征级别观点挖掘任务的开展。此外,许多评论中都并未以字面形式显式...

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

图1.1文章组织架构图

图1.1文章组织架构图

下图1.1为本文的文章组织结构图。第一节特征级别观点挖掘研究现状


图3.1模型整体流程图

图3.1模型整体流程图

本文中构建的隐性特征识别模型,主要是由数据预处理、基于BERT和CRF的观点内容提取、构建特征类指示词表、基于BERT-AV(BERT-AspectVector)的隐性特征类识别四部分构成,模型的框架如图3.1所示。在线评论通过数据预处理后,输入到BERT-CRF的观点提取模型....


图3.2基于BERT-CRF的观点提取

图3.2基于BERT-CRF的观点提取

本节中介绍的观点内容抽取,是通过序列标注识别出评论中所包含的一个或多个观点内容。在BERT最后输出上加入CRF层,CRF能够约束标签之间的关系,统计类别转移概率能够保证预测的序列标签符合规则。CRF层可以在训练过程中学习到标签内的约束关系,减少错误的预测序列出现。图3.2描述的即....


图3.3BERT模型结构图

图3.3BERT模型结构图

输出层位于多层隐藏层的后一层,其主要作用是获取[CLS]标记对应的表示作为整个序列的表示,并且返回多层隐藏层所获得的所有标记表示。在BERT的输出中,通常是根据下游任务的需要选取输出的表示。由于BERT具有多层Transformer层,每层都可以捕获到不同的特征信息,在不同任务下....



本文编号:3894208

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/gongyejingjilunwen/3894208.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户bec3b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com