当前位置:主页 > 社科论文 > 图书档案论文 >

基于文本和网络信息的学者兴趣挖掘研究

发布时间:2024-06-30 02:20
  学者的兴趣标签不仅仅能体现学者本身的学术研究内容与方向,也体现学者对某一个或多个科研领域的关注程度。现有的学者兴趣标签挖掘方法大多基于学者的论文中包含的文本信息和网络结构信息进行分类,但是在对文本信息的利用上,现有的方法大多采用概率主题模型生成文本属性,得到的文本信息属性粒度较粗;在对网络结构信息的利用上,现有的方法则大多将原本隐含在论文信息中的异构信息网络解构成多个同质网络进行节点嵌入的获取,丢失了异构信息网络中丰富的异构语义信息。在前人研究的基础上,本文基于文本属性和网络属性对学者兴趣标签进行研究,主要贡献如下:(1)提出基于文本信息的兴趣标签评分方法。我们对文本信息采取词级别的向量表示,并利用双向长短记忆循环神经网络捕获文本数据中的上下文信息,同时采用注意力机制加权文本中不同位置的信息,且将聚合得到的兴趣标签评分向量经过全连接层和输出层降维,从而最终得到兴趣标签的评分。(2)提出基于网络结构信息的兴趣标签评分方法。为了保留异构信息网络中的语义信息,我们对网络结构信息采用生成式对抗网络来获取异构信息网络中的节点嵌入,并将其用于计算学者之间的相似度,进而获得待预测学者的兴趣标签评分。...

【文章页数】:56 页

【学位级别】:硕士

【部分图文】:

图1.1北京文献服务处参赛方案结构

图1.1北京文献服务处参赛方案结构

内蒙古大学硕士学位论文3图1.1北京文献服务处参赛方案结构Figure1.1structureofthesolutionfromBeijingDocumentServiceDepartment北京文献服务处的参赛方案首先对给定数据进行了扩展,一方面利用给定数据中的期刊或会议名称信....


图1.2moon-light团队参赛方案结构

图1.2moon-light团队参赛方案结构

内蒙古大学硕士学位论文3图1.1北京文献服务处参赛方案结构Figure1.1structureofthesolutionfromBeijingDocumentServiceDepartment北京文献服务处的参赛方案首先对给定数据进行了扩展,一方面利用给定数据中的期刊或会议名称信....


图1.3ICRC@HITSZ团队参赛方案结构

图1.3ICRC@HITSZ团队参赛方案结构

基于文本和网络信息的学者兴趣挖掘研究6图1.3ICRC@HITSZ团队参赛方案结构Figure1.3structureofthesolutionfromteamICRC@HITSZ在网络结构属性方面,采用LINE[15]方法根据论文数据中的合著网络和引用关系网络生成节点嵌入;在文....


图2.1CBOW模型的模型结构

图2.1CBOW模型的模型结构

基于文本和网络信息的学者兴趣挖掘研究10藏层巨大的计算量,Word2Vec模型提出的CBOW模型和skip-gram模型都是不含隐藏层的两层神经网络模型。其中CBOW模型的思想上通过已知的上下文信息来预测中心词,而skip-gram模型则是相反,通过已知的中心词来预测上下文词汇。....



本文编号:3998245

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3998245.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f6082***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com