当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于机器学习的推荐技术研究

发布时间:2017-06-26 01:17

  本文关键词:基于机器学习的推荐技术研究,,由笔耕文化传播整理发布。


【摘要】:随着互联网的发展,每天产生的数据量已经与日俱增,传统的搜索引擎已经无法完全满足当前的需求,推荐系统成为了互联网时代的新宠,其是为了解决海量数据所带来的挑战以及给用户更好的体验而发展成一门交叉学科。推荐系统算法通常会包含机器学习算法,而云计算的广泛应用也使得机器学习算法可以快速的部署与运算,为推荐系统的性能与效果提升提供了保障。本文对目前的机器学习算法与推荐系统进行了研究。采用天猫淘宝真实数据集,并利用阿里巴巴的ODPS云计算平台,基于混合技术与深度学习技术构建了两套推荐系统,并对随机森林算法在不平衡数据条件下有针对性的进行了改善。本文主要工作如下:1.利用Ali Mobile Rec数据集与ODPS平台构建了基于混合技术的推荐系统,该系统使用了多种混合策略,包括特征混合技术、分级型混合推荐技术、瀑布型混合技术、加权混合推荐技术,最后利用多个模型进行融合,取得了较好的实验效果,最终F1值为8.11%,并在此基础上验证了各混合技术的提升效果以及使用条件;2.利用Taobao Clothes Match数据集以及ODPS平台构建了基于深度学习的搭配推荐系统,该系统利用服装的搭配套餐进行商品推荐,尝试提取图片中所蕴含的信息,利用卷积神经网络进行特征提取,并提出了基于卷积神经网络的排序修正算法,实验获得MAP值为4.6%,这表明该算法可以提高推荐系统的效果;3.针对推荐系统所使用的数据具有的正负样本的不平衡性,对现有的基于不平衡样本的随机森林算法进行了进一步的改善。根据混合策略中的瀑布型混合技术对随机森林样本空间的采样做了基于先验的样本空间定向采样,并对原改进算法中的分层特征空间选择做了基于分类强度的自适应的调整,实验表明这些改善能一定程度的提高算法的效果。
【关键词】:机器学习 混合技术 深度学习 随机森林
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3;TP181
【目录】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第1章 绪论9-13
  • 1.1 课题的研究背景和意义9
  • 1.2 国内外研究现状及面临问题9-11
  • 1.2.1 国内外研究现状9-10
  • 1.2.2 研究面临的问题10-11
  • 1.3 本文的研究内容和结构11-13
  • 第2章 推荐系统常用技术13-19
  • 2.1 推荐系统框架13
  • 2.2 常用推荐算法13-17
  • 2.2.1 基于内容的推荐算法14
  • 2.2.2 基于协同过滤的推荐系统算法14-17
  • 2.3 推荐系统评价标准17-18
  • 2.3.1 均方根误差与平均绝对误差17
  • 2.3.2 F1-Measure评估指标与ROC曲线17-18
  • 2.3.3 平均正确率均值18
  • 2.4 本章小结18-19
  • 第3章 机器学习算法19-29
  • 3.1 逻辑回归算法19-21
  • 3.2 梯度迭代决策树算法21-23
  • 3.2.1 决策树21-23
  • 3.2.2 梯度迭代回归树23
  • 3.3 因子分解机算法23-25
  • 3.3.1 因子分解机模型24
  • 3.3.2 因子分解机的参数学习24-25
  • 3.4 卷积神经网络算法25-27
  • 3.4.1 CNN的整体架构25-26
  • 3.4.2 卷积与池化26-27
  • 3.5 本章小结27-29
  • 第4章 基于融合技术与深度学习的推荐系统构建29-47
  • 4.1 推荐系统中的混合技术29-30
  • 4.2 基于混合技术的推荐系统30-36
  • 4.2.1 整体框架30-32
  • 4.2.2 基于滑窗与探索性数据分析的样本构建32-35
  • 4.2.3 基于瀑布式混合策略的数据过滤35-36
  • 4.3 基于深度学习的搭配推荐系统36-40
  • 4.3.1 整体框架37
  • 4.3.2 基于MapReduce的召回集触发实现37-39
  • 4.3.3 基于卷积神经网络的排序修正39-40
  • 4.4 实验结果与分析40-45
  • 4.4.1 实验平台与数据40-42
  • 4.4.2 实验结果42-45
  • 4.5 本章小结45-47
  • 第5章 随机森林改进算法47-55
  • 5.1 随机森林原理47-48
  • 5.2 基于不平衡样本的随机森林改进算法48-52
  • 5.2.1 面向不平衡数据的随机森林子空间选择49-50
  • 5.2.2 基于先验的样本空间定向采样50-51
  • 5.2.3 基于分类强度的分层特征空间选择自适应算法51-52
  • 5.3 实验结果与分析52-54
  • 5.4 本章小结54-55
  • 第6章 总结与展望55-57
  • 6.1 论文工作总结55
  • 6.2 下一步工作55-57
  • 参考文献57-61
  • 作者简介及科研成果61-62
  • 致谢62

【相似文献】

中国期刊全文数据库 前10条

1 张明玉,倪志伟;基于机器学习的智能决策支持系统[J];淮南师范学院学报;2005年03期

2 杨凌霄;武建平;;机器学习方法在人脸检测中的应用[J];计算机与数字工程;2008年03期

3 ;第十一届中国机器学习会议[J];智能系统学报;2008年02期

4 ;第14届中国机器学习会议[J];智能系统学报;2012年06期

5 费宗铭;吕建;王志坚;陈道蓄;徐家福;;机器学习[J];计算机科学;1991年01期

6 赵沁平;魏华;王军玲;;机器学习技术与机器学习系统[J];计算机科学;1993年05期

7 姚敏;机器学习及其发展方向[J];计算机时代;1994年04期

8 ;第31届机器学习国际会议(英文)[J];智能系统学报;2014年01期

9 黄海滨;机器学习及其主要策略[J];河池师范高等专科学校学报(自然科学版);2000年04期

10 佘玉梅;一种协调机器学习方法研究[J];云南民族学院学报(自然科学版);2000年03期

中国重要会议论文全文数据库 前10条

1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年

2 王昊;李银波;纪志梁;;利用机器学习方法预测严重药物不良反应-呼吸困难[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年

3 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

4 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年

5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年

7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年

9 程国建;蔡磊;潘华贤;;核向量机在大规模机器学习中的应用[A];第十一届中国青年信息与管理学者大会论文集[C];2009年

10 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年

中国重要报纸全文数据库 前10条

1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年

2 IBM大数据专家 James Kobielus 范范 编译;机器学习已成为大数据基石[N];网络世界;2014年

3 本报记者 房琳琳;合久必分:分布式“机器学习”应运而生[N];科技日报;2014年

4 雨辰;机器学习类图书为什么火爆[N];中华读书报;2014年

5 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年

6 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年

7 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年

8 记者  彭德倩;机器学习精度提升近6个百分点[N];解放日报;2006年

9 本报记者 闵杰;大数据热 高端人才缺[N];中国电子报;2013年

10 沈建苗 编译;如何成为大数据科学家[N];计算机世界;2013年

中国博士学位论文全文数据库 前10条

1 董春茹;机器学习中的权重学习与差分演化[D];华南理工大学;2015年

2 姚明臣;机器学习和神经网络学习中的若干问题研究[D];大连理工大学;2016年

3 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年

4 胡巍;面向格结构的机器学习[D];上海交通大学;2009年

5 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年

6 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年

7 梁锡军;稀疏优化在机器学习中的若干应用[D];大连理工大学;2013年

8 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年

9 陈慧灵;面向智能决策问题的机器学习方法研究[D];吉林大学;2012年

10 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年

中国硕士学位论文全文数据库 前10条

1 毛海斌;基于半监督机器学习的情感分类领域适应问题研究[D];南京理工大学;2015年

2 安军辉;基于微博数据的微博用户性别判断研究[D];华中师范大学;2015年

3 陈召阳;基于机器学习的改性麦槽吸附重金属构效关系模型研究[D];江西理工大学;2014年

4 王成;基于半监督机器学习的文本情感分析技术[D];南京理工大学;2015年

5 孙科;基于Spark的机器学习应用框架研究与实现[D];上海交通大学;2015年

6 刘江龙;基于机器学习的射频指纹定位方法研究[D];电子科技大学;2015年

7 张蕾;基于机器学习的网络舆情采集技术研究与设计[D];电子科技大学;2014年

8 施宇;基于数据挖掘和机器学习的木马检测系统设计与实现[D];电子科技大学;2014年

9 施应敏;基于机器学习的Femtocell信道频谱与功率资源分配算法的研究[D];南京邮电大学;2015年

10 张柯;基于机器学习的错误定位方法研究[D];南京航空航天大学;2015年


  本文关键词:基于机器学习的推荐技术研究,由笔耕文化传播整理发布。



本文编号:484282

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/484282.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e622b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com