当前位置:主页 > 科技论文 > 搜索引擎论文 >

领域本体的藏文主题爬虫搜索策略研究

发布时间:2017-06-27 00:12

  本文关键词:领域本体的藏文主题爬虫搜索策略研究,,由笔耕文化传播整理发布。


【摘要】:针对目前没有通用藏文搜索引擎的情况,提出一种基于领域本体的面向主题的藏文信息爬取策略。策略首先根据藏文和藏文编码的特点,判断出藏文Web并进行映射转换。然后通过构建领域本体,进行概念相似性计算,得到领域主题相关性网页。实验结果表明,该方法能够自动发现领域内的主题相关资源,并且比基于关键词的藏文网页信息搜索能得到更好的查全率和查准率,可以作为藏文Web语义搜索研究的参考。
【作者单位】: 西藏大学工学院;
【关键词】本体 相似度计算 藏文网页 主题发现
【基金】:国家自然科学基金重点项目(61331013);国家自然科学基金项目(61165013) 西藏大学青年培育基金项目(ZDPJZK201302)
【分类号】:TP391.1
【正文快照】: 13);国家自然科学基金项目(61165013);西藏大学青年培育基金项目(ZDPJZK201302)。高红梅,讲师,主研领域:信息处理技术本体。仁青诺布,副教授。普次仁,副教授。0引言藏文字作为一种古老的文字,文献资源丰富,不仅我国藏族地区使用,尼泊尔、不丹、印度、蒙古等国也有一部分人使用

【参考文献】

中国期刊全文数据库 前5条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 崔其文;解福;;改进的领域本体概念语义相似度计算方法[J];计算机应用与软件;2012年02期

3 王兰成;朱建华;;网络信息采集中链接与主题相关性的判定研究[J];计算机应用与软件;2012年05期

4 扎西加;珠杰;;面向信息处理的藏文分词规范研究[J];中文信息学报;2009年04期

5 珠杰;欧珠;格桑多吉;扎西加;高红梅;;藏文音节规则库的建立与应用分析[J];中文信息学报;2013年02期

中国博士学位论文全文数据库 前1条

1 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年

【共引文献】

中国期刊全文数据库 前10条

1 梁峰;金莹;;基于Agent技术的语义网服务模型[J];安徽广播电视大学学报;2008年01期

2 陶皖,李平,廖述梅;当前基于本体的语义标注工具的分析[J];安徽工程科技学院学报(自然科学版);2005年02期

3 赵秀芳;;基于本体的农业信息检索[J];安徽农业科学;2006年10期

4 蔡f

本文编号:488036


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/488036.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户93eaa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com