当前位置:主页 > 科技论文 > 搜索引擎论文 >

金融主题垂直搜索引擎的研究与实现

发布时间:2016-06-05 14:01

  本文关键词:金融主题垂直搜索引擎的研究与实现,由笔耕文化传播整理发布。


《浙江工业大学》 2014年

金融主题垂直搜索引擎的研究与实现

胡晓婷  

【摘要】:随着信息科学的进步与互联网信息资源爆炸性的增长,搜索引擎已经成为互联网最重要的应用之一。面对浩瀚的网络资源,通用的搜索引擎存在信息量大、查询不准确、深度不够等问题,因而垂直搜索引擎应运而生,它具有“专、精、深”的特点,并且具有行业色彩,能够对某一特定领域、特定人群或特定需求提供有价值的信息和相关服务。 本课题专注于金融主题垂直搜索引擎的研究与实现,通过技术研究建立金融主题的垂直搜索引擎,从海量的信息资源中筛选出满足用户需求的金融信息。 本文讨论和研究搜索引擎和垂直搜索引擎的相关原理、技术和实现过程,在此基础上,利用开源的Heritrix爬虫工具包、Lucene全文检索工具包、HtmlParser解析工具包和ICTCLAS分词系统实现金融主题垂直搜索引擎的网页抓取模块、预处理模块、索引模块和查询模块四个核心模块。该搜索引擎在网页抓取模块中建立金融主题词库,根据适用于主题判别的向量空间算法,修改Heritrix爬虫工具包使其支持超链接的过滤;在预处理模块中利用HtmlParsel解析工具包结合统计学对网页文件进行去噪;在索引模块中修改Lucene全文检索工具包使其支持ICTCLAS分词系统,利用Lucene对网页内容进行分词和建立倒排索引,提高了搜索引擎的查询的效率和准确率;在查询模块中利用ICTCLAS分词系统和Lucene全文检索工具包,使查询结果符合用户的需求。 实验结果表明金融主题的垂直搜索引擎能够较好满足用户对金融主题信息的需求。

【关键词】:
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前2条

1 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期

2 方志坚;张瑞林;童小素;;搜索引擎综合分析[J];计算机工程与设计;2007年16期

【共引文献】

中国期刊全文数据库 前10条

1 杜道流;指称、陈述理论及其对上古语法研究的意义[J];安徽大学学报;2004年01期

2 姜红;;具体名词和抽象名词的不对称现象[J];安徽大学学报(哲学社会科学版);2009年02期

3 施发笔;试论《水浒传》介词避复的技巧[J];安徽教育学院学报;2002年04期

4 阮绪和;形名偏正结构的语法功能[J];安徽教育学院学报;2003年02期

5 陶振伟;;“拿”的语法化[J];安徽教育学院学报;2006年04期

6 樊友新;;从“被就业”看“被”的语用功能[J];合肥师范学院学报;2010年02期

7 冯鸣;英语表持续时段的for短语和汉语时量词语的比较[J];安徽广播电视大学学报;2001年02期

8 王有卫;;语素文字说质疑[J];安徽广播电视大学学报;2010年03期

9 王正;陆余良;刘金红;施凡;;基于Lucene的互联网文献信息检索系统的研究[J];安徽大学学报(自然科学版);2009年05期

10 柳国栋;;《论语》重叠词略论[J];安徽职业技术学院学报;2008年02期

中国重要会议论文全文数据库 前10条

1 吴晨生;刘彦君;张鲁冀;董晓晴;;科普搜索的研究与实现[A];数字博物馆研究与实践(2009)[C];2010年

2 李影;付莉;;韩国中小学生“是”的错序偏误分析[A];语言与文化研究(第四辑)[C];2009年

3 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年

4 吕晓玲;;闽南方言南安话的类结构助词“得”、“说”、“伊”、“通”[A];福建省辞书学会第五届会员代表大会暨第十九届年会论文集[C];2009年

5 田长生;;浅谈《论语》中的复叠现象[A];江西省语言学会2005年年会论文集[C];2005年

6 阮绪和;;江西武宁(上汤)话的程度副词“死、几、蛮”[A];江西省语言学会2005年年会论文集[C];2005年

7 魏亮珍;;浅析《吕梁英雄传》中的“给”[A];江西省语言学会2006年年会论文集[C];2006年

8 周小婕;;数词研究综述[A];江西省语言学会2006年年会论文集[C];2006年

9 王安琛;;试论“V—V”结构[A];江西省语言学会2006年年会论文集[C];2006年

10 王安琛;;重叠式动补短语的句法语义分析[A];江西省语言学会2006年年会论文集[C];2006年

中国博士学位论文全文数据库 前10条

1 陈佳;论英汉运动事件表达中“路径”单位的“空间界态”概念语义及其句法—语义接口功能[D];上海外国语大学;2010年

2 郭红;基于第二语言教学的汉语语气范畴若干问题研究[D];南开大学;2010年

3 杨先明;0-5岁汉语儿童语言发展的认知研究[D];武汉大学;2010年

4 彭懿;英汉肤觉形容词的认知语义研究[D];湖南师范大学;2010年

5 龙又珍;现代汉语寒暄系统研究[D];武汉大学;2009年

6 李青;现代汉语把字句主观性研究[D];吉林大学;2011年

7 朱怀;概念整合与汉语非受事宾语句[D];吉林大学;2011年

8 王欣;汉日否定表达对比研究[D];吉林大学;2011年

9 莫启扬;语言中的时间性及其操作[D];西南大学;2011年

10 吴淑琼;基于汉语句法结构的语法转喻研究[D];西南大学;2011年

中国硕士学位论文全文数据库 前10条

1 黄雪;俄汉语词汇理据性对比研究[D];哈尔滨师范大学;2010年

2 马晶晶;表人名词类词缀“X手”、“X者”、“X员”分析比较[D];辽宁师范大学;2010年

3 乌晓丽;“X+—N比—N+VP”表义功能新探[D];辽宁师范大学;2010年

4 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年

5 曹萍;府城官话研究[D];广西师范学院;2010年

6 旷金辉;汉英名词前置修饰语语序对比研究[D];上海外国语大学;2010年

7 陶胜妃;现代汉语谓词修饰词前后位置比较研究[D];上海外国语大学;2010年

8 严伟剑;疑问代词“怎么”“怎样”“怎么样”对比研究[D];上海外国语大学;2010年

9 耿冰;“实现事件”结构词汇化模式的英汉对比研究[D];上海外国语大学;2010年

10 王冰;《红楼梦》中茶”相关行为映射译者风格研究[D];大连理工大学;2010年

【二级参考文献】

中国期刊全文数据库 前4条

1 李盛韬,赵章界,余智华;基于主题的Web信息采集系统的设计与实现[J];计算机工程;2003年17期

2 李卫;刘建毅;何华灿;王枞;;基于主题的智能Web信息采集系统的研究与实现[J];计算机应用研究;2006年02期

3 李蕾,王楠,钟义信,郭祥昊,韩鹏,贾自燕,高清霞;基于语义网络的概念检索研究与实现[J];情报学报;2000年05期

4 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期

【相似文献】

中国期刊全文数据库 前10条

1 郑凯明;李义杰;;垂直搜索引擎及其应用价值[J];信息技术;2008年04期

2 许鑫;黄仲清;;垂直搜索引擎应用中的若干策略探讨——以12580餐饮垂直搜索为例[J];现代图书情报技术;2009年02期

3 肖婷;;垂直搜索引擎与旅游行业探讨[J];农业网络信息;2009年11期

4 祝奕;;垂直搜索引擎的构建与应用[J];信息与电脑(理论版);2010年01期

5 张美芳;张迎春;;浅议垂直搜索引擎服务市场的商业模式[J];现代商业;2010年06期

6 焦龙;;垂直搜索引擎在旅游企业中应用的探索[J];商场现代化;2010年08期

7 赵宏中;李亚;;垂直搜索引擎应用研究[J];现代商贸工业;2010年04期

8 陈高维;邓天权;曾云磊;王维国;张龙;;基于垂直搜索引擎的旅游线路评价模型的设计[J];科技创新导报;2010年18期

9 刘小强;;二手转让及房产租售垂直搜索引擎的设计与实现[J];三门峡职业技术学院学报;2010年03期

10 郑凯明;;垂直搜索引擎应用研究[J];赤峰学院学报(自然科学版);2011年02期

中国重要会议论文全文数据库 前4条

1 褚蓓蓓;刘丹;;垂直搜索引擎:搜索引擎发展方向[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年

2 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

3 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

4 毛华扬;刘卫;;会计信息搜索方法研究[A];第十届全国会计信息化年会论文集[C];2011年

中国重要报纸全文数据库 前10条

1 北大纵横管理顾问公司高级顾问戴晓东;[N];中国经营报;2006年

2 王艳;[N];中国旅游报;2000年

3 王靖;[N];人民日报海外版;2000年

4 杨国民;[N];经济日报;2007年

5 本报记者 王晓雁;[N];法制日报;2009年

6 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;[N];计算机世界;2010年

7 中新;[N];经理日报;2008年

8 源讯 编译;[N];计算机世界;2006年

9 赛迪网 方刚;[N];中国计算机报;2000年

10 ;[N];中国贸易报;2007年

中国博士学位论文全文数据库 前5条

1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年

2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年

3 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年

4 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年

5 王桂红;农产品市场价格web信息分析方法研究[D];沈阳农业大学;2013年

中国硕士学位论文全文数据库 前10条

1 海涛;垂直搜索引擎数据采集技术的研究与实现[D];华北电力大学(北京);2008年

2 崔诗远;基于垂直搜索引擎的旅行社网络营销[D];青岛大学;2009年

3 翟晓玲;面向学科的基础教育资源垂直搜索引擎的研究与实现[D];东北师范大学;2009年

4 王嘉杰;面向博客领域的垂直搜索引擎的研究与实现[D];北京邮电大学;2009年

5 刘明君;垂直搜索引擎传播学特征及应用研究[D];华中科技大学;2008年

6 黎斌;可扩展分布式垂直搜索引擎设计与实现研究[D];国防科学技术大学;2008年

7 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年

8 石占伟;垃圾页面检测及其在垂直搜索引擎中的应用[D];燕山大学;2010年

9 张楠;面向汽车主题的垂直搜索引擎研究与实现[D];西南交通大学;2010年

10 陈向东;宠物用品垂直搜索引擎研究与设计[D];西北农林科技大学;2010年


  本文关键词:金融主题垂直搜索引擎的研究与实现,,由笔耕文化传播整理发布。



本文编号:53740

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/53740.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户16c32***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com