当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于社会化标注的搜索引擎优化研究

发布时间:2016-11-10 08:10

  本文关键词:基于五大因素的搜索引擎优化研究,由笔耕文化传播整理发布。


《扬州大学》 2008年

基于社会化标注的搜索引擎优化研究

张晖  

【摘要】: 社会化标签作为web2.0中的一种重要技术,最显著的贡献在于完成了用户从单纯的信息接收者到主动的信息发布者的角色转换,深刻地影响着互联网上的信息传播模式。通过标签,其他网站或网民可以便捷地对信息进行分类。标签的作用类似于搜索技术中的关键字,是对信息的个性化描述。由于一般情况下无法对网络上海量的信息进行全文检索(只有功能强大的大型搜索引擎才能勉强做到),因而,具有标签的信息要比没有标签的信息更容易传播。网民通过“贴”标签来描述信息,创造易于被他人检索的信息,同时也通过标签的描述来查找自己感兴趣的信息。并且由于聚合内容技术与标签技术的有机结合,标准化的信息接口降低了信息传播和信息再次加工的成本,从而降低了人们在获取个性化信息上的时间成本和经济成本。通过社会化书签,可以用多个标签作为关键字,对所喜爱的网站或网页(由网络中的书签所指向)进行标注,并与其他网民分享。社会化标签的作用类似于分类式的搜索引擎,其区别在于社会化标签的创建者是一个个普通网民,而不是什么实力雄厚的公司,因而具有更强的实效性,甚至在分类上更为准确。 随着web2.0技术影响力的不断扩大,web上可以挖掘的资源更加丰富。结合社会化标签来优化搜索引擎的检索效率不但能够快速准确的定位用户所需的信息,而且能够满足用户对信息个性化方面的需求,从而在很大程度上改善了用户的搜索体验,因此对这部分内容的研究也将具有重要的商业价值。 论文的主要工作包括以下三个方面: (1)基于社会化标注内容的研究 本文主要根据标签的语义来判断社会化标注的内容。通过比较标签与网页内容之间、标签与标签之间的语义关系,确定标签与网页内容之间、标签与标签之间的语义相似度,并根据该相似度对搜索引擎用户进行推荐,提高其对搜索的满意度,从而达到优化搜索引擎的目的。 (2)基于社会化标注重要性的研究 衡量标签的重要性有多个方面,本文主要考察的角度是时间。通过对社会化标签网下新的数据源“标签”的时间因素加以分析和利用,从时间的角度衡量标签的新颖程度和重要程度,提出了一种新的基于社会化标签的网页排名算法TagRank,该算法通过对网页上用户的标注行为进行挖掘,计算标签的“热度”,从而更客观的反应出标签的真实质量,以此提高网页排名的准确性。实验证明该算法是切实有效的。 (3)基于社会化标注个性化的研究 基于社会化标注个性化研究不需要用户的主动参与,而是通过对共现tag的数据加以过滤,对用户的标注数据聚类并获取用户的偏好,达到对tag进行层次上分类的效果,从而得到一个关于用户的特征,根据该特征向用户有的放矢的推荐,最终成功的为用户提供个性化服务。

【关键词】:
【学位授予单位】:扬州大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP391.3
【目录】:

  • 中文摘要4-6
  • 英文摘要6-8
  • 第一章 绪论8-12
  • 1.1 论文研究背景和意义8-10
  • 1.1.1 研究背景8-9
  • 1.1.2 研究意义9-10
  • 1.2 研究方案10-11
  • 1.2.1 研究的主要内容10
  • 1.2.2 研究总体方案10-11
  • 1.3 论文的组织结构11-12
  • 第二章 相关工作12-24
  • 2.1 Web 挖掘概述12-16
  • 2.1.1 Web 挖掘的特点12-13
  • 2.1.2 Web 挖掘流程13-14
  • 2.1.3 Web 挖掘分类14-16
  • 2.2 搜索引擎优化概述16-20
  • 2.2.1 搜索引擎优化的研究现状17-19
  • 2.2.2 搜索引擎优化方法19-20
  • 2.2.3 目前搜索引擎优化存在的不足20
  • 2.3 社会化标签的概述20-23
  • 2.3.1 社会化标签的研究现状20-22
  • 2.3.2 使用社会化标签的优势22-23
  • 2.4 本章小结23-24
  • 第三章 基于社会化标注内容及重要性的搜索引擎优化24-33
  • 3.1 主要技术24-26
  • 3.2 基于标签热度的 TagRank 算法26-30
  • 3.3 实验与评估30-32
  • 3.3.1 数据准备30-31
  • 3.3.2 数据处理31
  • 3.3.3 实验结果31-32
  • 3.4 本章小结32-33
  • 第四章 基于社会化标注个性化的搜索引擎优化33-44
  • 4.1 主要技术33-34
  • 4.2 基于社会化标签的聚类34-37
  • 4.3 聚类算法37-42
  • 4.3.1 Tag 间相似度的计算(Similarity between co-tag)37-40
  • 4.3.2 聚类算法40-42
  • 4.4 实验与评估42-43
  • 4.5 本章小结43-44
  • 第五章 总结与展望44-46
  • 5.1 本文工作总结44-45
  • 5.2 未来工作展望45-46
  • 参考文献46-52
  • 致谢52-53
  • 攻读硕士学位期间发表的学术论文目录53-54
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【引证文献】

    中国期刊全文数据库 前1条

    1 夏秀峰;张姝;李晓明;;一种个性化标签云中的标签排序算法[J];沈阳航空航天大学学报;2011年01期

    中国硕士学位论文全文数据库 前5条

    1 胡毅;搜索引擎优化及其应用研究[D];云南大学;2011年

    2 王传豹;基于协同过滤和文本相似度的标签推荐及搜索优化[D];河北大学;2011年

    3 张姝;基于社会化标签的个性化推荐技术研究[D];沈阳航空航天大学;2011年

    4 谢飞;基于SEO理论的物业企业网络学习平台的研究与设计[D];北京林业大学;2012年

    5 高连花;基于社会化标签的个性化信息服务研究[D];华中师范大学;2012年

    【同被引文献】

    中国期刊全文数据库 前10条

    1 刘妮;唐慧佳;;Web挖掘在基于标签的个性化推荐中的应用[J];成都信息工程学院学报;2007年04期

    2 杨丹;曹俊;;基于Web2.0的社会性标签推荐系统[J];重庆工学院学报(自然科学版);2008年07期

    3 焦丽;路波;;基于五大因素的搜索引擎优化研究[J];中国管理信息化;2009年17期

    4 夏秀峰;李磊;郝仲模;;以客户智能为引擎的分析型CRM体系结构[J];沈阳航空工业学院学报;2009年01期

    5 夏秀峰;殳晶莹;;一种基于中间商品兴趣度的滞销商品推荐模型[J];沈阳航空工业学院学报;2009年05期

    6 孙红莺;次仁拉珍;叶鹰;;基于标签的数字图书馆个性化信息检索[J];杭州师范大学学报(自然科学版);2008年05期

    7 王庆林;薛惠锋;林波;;基于图聚类的协同标记系统资源个性推荐[J];计算机工程与应用;2010年11期

    8 夏秀峰;代沁;丛丽晖;;用户显意识下的多重态度个性化推荐算法[J];计算机工程与应用;2011年16期

    9 余正涛,宋丽哲,樊孝忠;基于本体的个性化领域信息服务[J];计算机工程;2005年05期

    10 张永;迟忠先;闫德勤;;数据仓库ETL中相似重复记录的检测方法及应用[J];计算机应用;2006年04期

    中国博士学位论文全文数据库 前3条

    1 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年

    2 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年

    3 史斌;面向语义网的语义搜索引擎关键技术研究[D];北京工业大学;2010年

    中国硕士学位论文全文数据库 前10条

    1 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年

    2 苏磊;面向搜索引擎优化的网站建设方法研究[D];天津大学;2006年

    3 林海霞;中文专业搜索引擎优化策略研究[D];燕山大学;2006年

    4 张光年;企业网站的搜索引擎优化研究[D];厦门大学;2007年

    5 陈琛;基于社会化标签的个性化搜索研究[D];扬州大学;2008年

    6 周翔;基于e-learning模式的培训管理研究[D];武汉科技大学;2008年

    7 王海腾;基于多Agent的搜索引擎优化研究[D];哈尔滨工业大学;2007年

    8 蔡建超;基于PageRank算法的搜索引擎优化研究[D];江南大学;2008年

    9 浦浚;企业网络营销中的搜索引擎优化研究[D];电子科技大学;2008年

    10 张霄;搜索引擎优化与营销的分析与研究[D];北京邮电大学;2009年

    【二级引证文献】

    中国期刊全文数据库 前1条

    1 周碧晖;李景升;;一种国防教育资源多级标签云管理方法[J];湖南科技学院学报;2012年07期

    【相似文献】

    中国期刊全文数据库 前10条

    1 ;IE4.0中的热门设置[J];微电脑世界;1998年20期

    2 茆鸣;也为“件”当家“支招儿”[J];中国档案;2001年03期

    3 胡服骑射;;Firefox轻松玩转QQ书签[J];电脑迷;2007年16期

    4 殷荣庆;题库系统的设计与研究[J];安徽教育学院学报;2004年06期

    5 西格玛;;QQ书签也玩即时收藏[J];电脑迷;2007年15期

    6 张家明;网上行怎样省钱[J];电脑开发与应用;1999年04期

    7 林海;网上下载全功略[J];电脑;2000年04期

    8 卓庆民;IS-10的记忆功能-Bookmark[J];外语电化教学;1987年03期

    9 黄鹂,刘伟;Internet上个人地址资源的书签管理[J];现代图书情报技术;1999年06期

    10 张学军,张丽颖;如何实现上网加速[J];计算机时代;2000年03期

    中国重要会议论文全文数据库 前10条

    1 梅放;林鸿飞;;基于社会化标签的移动音乐检索[A];第五届全国信息检索学术会议论文集[C];2009年

    2 张亮;;社会书签、内容索引和网上个性化服务[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

    3 史云飞;吴江宁;;企业书签系统中的知识推荐研究[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年

    4 郭金芳;李英;;馆藏古籍状况及修复[A];中国文物保护技术协会第四次学术年会论文集[C];2005年

    5 吴曼;刘建民;程薇;彭红;刘明华;张晓龙;范德惠;;医疗机构药品差价率变化对北京市属医院经济运行和医药费用的影响——2000年-2007年北京市卫生局21家直属医院经济运行及医药费用分析[A];中国卫生经济学会第九批招标课题研究报告专集[C];2009年

    6 刘逸;;移动短信服务中的信息检索方式及其在黄页短信业务中应用的探索[A];2004年度中国索引学会年会暨学术讨论会论文集[C];2004年

    7 冯丹;郑振佺;汪雪莲;刘平;游在农;李淑挺;陈松涛;陈叶如;张海辉;任光东;汪涛;林翔;苏彩平;殷梅英;吴艳;陈怡;;大型医用设备检查治疗价格调整对医疗机构行为和患者经济负担的影响[A];中国卫生经济学会第九批招标课题研究报告专集[C];2009年

    8 孙诗兵;田英良;杜选东;张文俊;;外墙外保温不燃型保温岩棉问题与对策[A];2010年·中国绝热节能材料协会论文集[C];2010年

    9 谢永华;;OLE技术在Lotus Domino/Notes报表设计中的应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年

    10 陈彰评;周泱泱;刘馨;肖丽;汪莉;;有机化学多媒体软件的研制及在教学中的应用[A];第八届全国大学化学教学研讨会论文集[C];2005年

    中国重要报纸全文数据库 前10条

    1 记者 方圆;[N];中国新闻出版报;2010年

    2 肖文;[N];中国商报;2007年

    3 张健初;[N];中国消费者报;2002年

    4 江苏 罗松林;[N];中国计算机报;2001年

    5 王兰婷;[N];中国电脑教育报;2005年

    6 刘廷汉;[N];中国商报;2001年

    7 ;[N];电脑报;2001年

    8 李盛仙;[N];中国商报;2001年

    9 刘道宜;[N];中国集邮报;2005年

    10 记者 肖慧;[N];徐州日报;2010年

    中国硕士学位论文全文数据库 前10条

    1 张晖;基于社会化标注的搜索引擎优化研究[D];扬州大学;2008年

    2 孟庆海;基于社会书签的个性化查询词扩展技术研究[D];哈尔滨工程大学;2010年

    3 李向斐;基于REST风格的社会化书签服务研究与实现[D];北京邮电大学;2010年

    4 陈琛;基于社会化标签的个性化搜索研究[D];扬州大学;2008年

    5 梅放;基于社会化标签的移动音乐检索[D];大连理工大学;2009年

    6 徐法艳;基于Web挖掘技术的网页分类研究[D];扬州大学;2008年

    7 龚畅;基于web挖掘技术的网页分类研究[D];江南大学;2009年

    8 何堃;基于聚类的用户特征分析[D];扬州大学;2008年

    9 张姝;基于社会化标签的个性化推荐技术研究[D];沈阳航空航天大学;2011年

    10 宋勋超;文本聚类算法的语义性改进与实现[D];浙江大学;2011年


      本文关键词:基于五大因素的搜索引擎优化研究,由笔耕文化传播整理发布。



    本文编号:169528

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/169528.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户92a68***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com