当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于维吾尔文的聚焦策略爬虫技术研究

发布时间:2017-07-14 11:19

  本文关键词:基于维吾尔文的聚焦策略爬虫技术研究


  更多相关文章: 网络爬虫 维吾尔文聚焦策略 维吾尔文搜索引擎


【摘要】:随着网络资源的不断丰富,人们获取信息的途径已被网络代替。维吾尔文,在语言信息处理,WEB应用等领域有了迅速的发展。文章针对网络爬虫的工作原理以及聚焦爬虫策略进行阐述,在此基础上结合维吾尔语信息提取的相关研究,研究了维吾尔文的网络爬虫技术的结构和策略,从而为维吾尔文搜索引擎的网页数据库建设和维吾尔文网络舆情分析研究提供海量的语料。
【作者单位】: 新疆师范大学信息管理中心;
【关键词】网络爬虫 维吾尔文聚焦策略 维吾尔文搜索引擎
【分类号】:TP393.092;TP391.3
【正文快照】: 维吾尔语不仅是广大维吾尔群众相互交流的语言,也是传承着现代维吾尔族文化的有效载体。加强维吾尔语信息化建设,尤其是维吾尔语在计算机信息处理方面的研究,对于提升新疆和其他地区的文化交流,促进少数民族地区科技教育事业的蓬勃发展,以及加快少数民族语言文字的信息化建设

【参考文献】

中国期刊全文数据库 前1条

1 王岩;;搜索引擎中网络爬虫技术的发展[J];电信快报;2008年10期

【共引文献】

中国期刊全文数据库 前10条

1 朱华;浅谈网络信息资源采集技术[J];国家图书馆学刊;2004年02期

2 葛宇;梁静;陈晓敏;;搜索引擎系统中热点问题的探讨[J];成都电子机械高等专科学校学报;2009年04期

3 王春梅;;基于Bloom Filter的网络爬虫URL消重算法研究[J];产业与科技论坛;2011年18期

4 胡静芳;沈亚斌;;基于Web的新闻采集系统[J];电脑知识与技术;2009年19期

5 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期

6 郑凯;;基于动态评价URL链接结构的主题爬行策略[J];福建电脑;2010年02期

7 董日壮;郭曙超;;网络爬虫的设计与实现[J];电脑知识与技术;2014年17期

8 王宏伟;陈明华;谢世钟;;智能电网用电信息采集系统EPONDBA算法研究[J];光通信技术;2014年02期

9 杨宝森;来玲;;面向学科的网络信息挖掘系统研究[J];情报理论与实践;2006年02期

10 陆蓓;程肖;谌志群;;互联网舆情挖掘研究述略[J];情报资料工作;2010年02期

中国重要会议论文全文数据库 前5条

1 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年

2 徐剑;柯贵明;;网络爬虫技术在搜索引擎中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

3 李盛韬;吴丽辉;于满泉;潘文锋;余智华;王斌;程学旗;;主题Web信息采集的研究与设计[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

4 张凯;李魁;张刚;王斌;;基于站点的Web信息采集器研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

5 张凯;丁国栋;张刚;;GatherCore:一种面向采集系统的工具集[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

中国博士学位论文全文数据库 前1条

1 王桂红;农产品市场价格web信息分析方法研究[D];沈阳农业大学;2013年

【二级参考文献】

中国期刊全文数据库 前1条

1 刘世涛;;简析搜索引擎中网络爬虫的搜索策略[J];阜阳师范学院学报(自然科学版);2006年03期

【相似文献】

中国期刊全文数据库 前10条

1 曹忠;赵文静;;一种优化的网络爬虫的设计与实现[J];电脑知识与技术;2008年35期

2 邹海亮;孙莉;;可定制的聚焦网络爬虫[J];电子科技;2009年01期

3 戚欣;;基于本体的主题网络爬虫设计[J];武汉理工大学学报;2009年03期

4 彭轲;廖闻剑;;基于浏览器服务的网络爬虫[J];硅谷;2009年04期

5 杨松梅;;网络爬虫[J];硅谷;2009年15期

6 张红云;刘炜;熊前兴;;一种基于语义本体的网络爬虫模型[J];计算机应用与软件;2009年11期

7 王江红;朱丽君;李彩虹;;一种新型网络爬虫的设计与实现[J];微计算机信息;2010年03期

8 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期

9 于成龙;于洪波;;网络爬虫技术研究[J];东莞理工学院学报;2011年03期

10 张睿涵;林振荣;李建民;衷湾;;基于主题定制的专利网络爬虫的设计与实现[J];计算机与现代化;2011年07期

中国重要会议论文全文数据库 前5条

1 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

2 李楠;谷利泽;钮心忻;;用于XSS扫描的网络爬虫的设计与实现[A];2010年全国通信安全学术会议论文集[C];2010年

3 徐剑;柯贵明;;网络爬虫技术在搜索引擎中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

4 张军;于浩;内野宽治;;UGC中产品评论信息的挖掘[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

5 王庆广;何力;韩伟红;;基于爬虫的有害网站发现与判别系统的实现[A];第27次全国计算机安全学术交流会论文集[C];2012年

中国硕士学位论文全文数据库 前10条

1 龚秋艳;并行网络爬虫设计与实现[D];华东师范大学;2010年

2 么士宇;基于分布式计算的网络爬虫技术研究[D];大连海事大学;2011年

3 陈奋;过滤型网络爬虫的研究与设计[D];厦门大学;2007年

4 金梅;网络爬虫性能提升与功能拓展的研究与实现[D];吉林大学;2012年

5 芮虎;比价购物平台中网络爬虫的设计与实现[D];华东理工大学;2013年

6 赵茉莉;网络爬虫系统的研究与实现[D];电子科技大学;2013年

7 刘晶晶;面向微博的网络爬虫研究与实现[D];复旦大学;2012年

8 谭龙远;基于领域的网络爬虫技术的研究与实现[D];武汉理工大学;2009年

9 张红云;基于页面分析的主题网络爬虫的研究[D];武汉理工大学;2010年

10 赵鹏程;分布式书籍网络爬虫系统的设计与实现[D];西南交通大学;2014年



本文编号:540887

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/540887.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户036b3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com