当前位置:主页 > 科技论文 > 搜索引擎论文 >

区分用户长短期兴趣的个性化动态推荐模型

发布时间:2017-06-27 08:16

  本文关键词:区分用户长短期兴趣的个性化动态推荐模型,,由笔耕文化传播整理发布。


【摘要】:面对互联网所引发的信息爆炸,个性化推荐相比于搜索引擎能够更好帮助用户发现兴趣,而用户兴趣建模作为个性化推荐的基础逐渐成为研究热点。同时,心理学家已经证明用户的兴趣往往会受环境的影响而变化。至此,用户兴趣的动态变化过程成为一个研究重点,而以往考虑时间因素的兴趣模型主要围绕时间窗与遗忘规律,且通常将用户兴趣当作一个整体进行处理,对长期与短期兴趣的区分性不强。因此,本文主要研究用户长短期兴趣建模、短期兴趣的模式识别以及基于长短期兴趣的推荐,具体内容如下:(1)一般认为,用户的长期兴趣是用户比较关注的、稳定的、不易改变的;用户的短期兴趣是用户不经常关注的、不稳定的、易改变的。为了能够构建一个自主区分用户长短期兴趣的兴趣模型,本文首先通过对天猫网上用户查询记录的收集与商品分类信息的爬虫、统计,获得用户的查询记录(用户ID、查询词、时间戳、访问链接)以及商品类别数据;然后对用户的查询词与商品类别数据进行分词并转换成TF-IDF值,计算两者的相似度,建立查询词与商品类别在最大相似度下的映射关系;再根据商品类别映射关系下查询词数量与该用户所有查询词数量的比值设定阈值,以此区分用户在商品类别下的长期兴趣与待定兴趣;最后对待定兴趣下查询词数量进行判断得到短期兴趣,按照加速度理论提出兴趣加速度的概念,用以表征用户短期兴趣的变化过程,生成兴趣加速度的图像。(2)为了能够实现用户短期兴趣模式的自动识别,本文首先根据兴趣加速度图像的变化规律,给出短期兴趣的六种不同模式(每一种模式都反映一种用户短期兴趣):正常模式、逐渐上升模式、逐渐下降模式、跳跃上升模式、跳跃下降模式、周期模式;然后根据兴趣加速度的最大向量维度进行线性拟合,自动补值,设计函数生成六种不同模式的训练数据;最后设计三层节点的BP神经网络以实现自动识别用户短期兴趣的模式。(3)为了实现区分用户长短期兴趣的商品推荐,本文暂将用户查询后访问的链接当作具体商品,构建一个用户-访问链接的矩阵表。若用户长期兴趣下的访问链接在此表中有出现,在对应位置标记为1,反之为0;对相同模式下的用户短期兴趣进行同样操作;然后基于用户协同过滤算法为用户分别实现区分长期与短期兴趣的链接推荐;再进行关键字符串匹配,得到具体商品链接,利用Web页面分析算法爬取,最终将具体商品推荐给用户。本文选用数据堂提供的天猫网用户的查询行为数据集,构建的模型能够较好区分用户长短期兴趣,得到较好推荐结果,在电商网站中具有一定应用价值。
【关键词】:个性化 动态化 长期兴趣 短期兴趣 兴趣加速度 模式识别 协同过滤
【学位授予单位】:安徽工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 1 绪论9-15
  • 1.1 研究背景9
  • 1.2 研究目的及意义9-10
  • 1.2.1 研究目的9-10
  • 1.2.2 研究意义10
  • 1.3 国内外研究现状10-12
  • 1.3.1 国外研究现状10-12
  • 1.3.2 国内研究现状12
  • 1.4 问题提出12-13
  • 1.5 研究内容及论文框架13-14
  • 1.5.1 研究内容13
  • 1.5.2 论文框架13-14
  • 1.6 本章小结14-15
  • 2 相关理论与技术15-22
  • 2.1 用户兴趣建模过程15-17
  • 2.1.1 数据收集15-16
  • 2.1.2 用户兴趣模型的表示16-17
  • 2.2 用户兴趣建模方法17-18
  • 2.3 正向最大匹配分词算法18
  • 2.4 TF-IDF算法18-19
  • 2.5 相似性公式19
  • 2.6 最小二乘法19
  • 2.7 BP神经网络算法19-20
  • 2.8 基于用户协同过滤算法20-21
  • 2.9 本章小结21-22
  • 3 区分用户长短期兴趣的自动化建模方法22-36
  • 3.1 数据收集22-24
  • 3.1.1 基于隐性收集方式的查询记录收集22-23
  • 3.1.2 基于爬虫的商品分类数据收集23-24
  • 3.2 基于正向最大匹配算法的查询词与商品类别分词24-26
  • 3.2.1 Python的jieba分词24
  • 3.2.2 查询词与商品分类数据的分词24-25
  • 3.2.3 基于TF-IDF算法的查询词与商品类别的表征25-26
  • 3.4 基于向量空间模型的长短期兴趣模型化表示26-29
  • 3.4.1 相似性计算26
  • 3.4.2 长期兴趣的模型化表示26-27
  • 3.4.3 短期兴趣模型化表示27-29
  • 3.5 实验结果与分析29-35
  • 3.5.1 实验软硬件环境29
  • 3.5.2 实验数据集29
  • 3.5.3 实验结果29-34
  • 3.5.4 结果分析34-35
  • 3.6 本章小结35-36
  • 4 基于BP神经网络的短期兴趣模式识别36-45
  • 4.1 短期兴趣的基本模式36-37
  • 4.2 基于最小二乘法的兴趣加速度线性拟合37-39
  • 4.3 短期兴趣模式下产生训练数据函数的设计39
  • 4.4 BP网络结构的确定39-40
  • 4.5 实验结果与分析40-44
  • 4.5.1 实验软硬件环境40
  • 4.5.2 实验数据集40-41
  • 4.5.3 实验结果41-44
  • 4.5.4 结果分析44
  • 4.6 本章小结44-45
  • 5 区分用户长短期兴趣的商品推荐45-53
  • 5.1 基于用户协同过滤算法的长短期兴趣的链接推荐45-46
  • 5.2 具体商品的推荐46-48
  • 5.3 实验结果与分析48-52
  • 5.3.1 实验软硬件环境48
  • 5.3.2 实验数据集48
  • 5.3.3 实验结果48-51
  • 5.3.4 结果分析51-52
  • 5.5 本章小结52-53
  • 6 总结与展望53-55
  • 6.1 总结53-54
  • 6.2 创新性54
  • 6.3 展望54-55
  • 参考文献55-59
  • 图目录59-60
  • 表目录60

【相似文献】

中国期刊全文数据库 前10条

1 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期

2 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期

3 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期

4 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期

5 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期

6 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期

7 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期

8 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期

9 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期

10 郑婕;鲍海琴;;基于协同过滤推荐技术的个性化网络教学平台研究[J];科技风;2012年06期

中国重要会议论文全文数据库 前10条

1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年

中国博士学位论文全文数据库 前10条

1 纪科;融合上下文信息的混合协同过滤推荐算法研究[D];北京交通大学;2016年

2 程殿虎;基于协同过滤的社会网络推荐系统关键技术研究[D];中国海洋大学;2015年

3 于程远;基于QoS的Web服务推荐技术研究[D];上海交通大学;2015年

4 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年

5 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年

6 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年

7 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年

8 高e

本文编号:489084


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/489084.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户03632***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com