当前位置:主页 > 科技论文 > 搜索引擎论文 >

藏文搜索引擎中的分词算法研究

发布时间:2017-06-17 04:02

  本文关键词:藏文搜索引擎中的分词算法研究,,由笔耕文化传播整理发布。


【摘要】:随着藏文信息技术的不断普及和发展,搜索引擎技术成为藏文信息处理一项新的研究课题。对搜集到的藏文网页文本或用户查询关键词进行理解、提取和组织等处理是搜索引擎的一项基础性工作,其中藏文分词的准确与否,直接影响到搜索引擎查询效果及查询结果列表的排序问题,因此分词成为藏文搜索引擎技术中需要解决的关键问题。文章针对藏文搜索引擎中基于字符串匹配的藏文分词技术进行研究并提出相应的解决算法。
【作者单位】: 西藏大学藏文信息技术研究中心;
【关键词】藏文搜索引擎 藏文文本 藏文分词
【基金】:2013年度西藏大学青年科研培育基金项目“藏文搜索引擎倒排索引模块的设计与实现”(项目号:ZDPJZK201310) 2011年度国家自然科学基金项目“基于虚词的藏语基本句型的形式化研究”(项目号:61063015);2011年度国家自然科学基金项目“藏语依存树库的构建”(项目号:61163043)阶段性成果
【分类号】:TP391.1
【正文快照】: 引言近几年藏文信息处理研究内容的不断扩展和深入,为藏文搜索引擎技术提供了较为实用的理论和实践基础。然而藏文分词处理技术作为藏文搜索引擎的基础环节,在整个搜索引擎中起着举足轻重的作用。如果不能很好的处理藏文分词问题,那么藏文搜索引擎也就无从谈起,成为无根之木。

【共引文献】

中国期刊全文数据库 前10条

1 丁俊苗;;不足与需要:论标点符号的语法功能[J];安徽大学学报(哲学社会科学版);2008年04期

2 魏顺平;;2010年度教育技术(远程教育)研究进展调查与分析[J];北京广播电视大学学报;2011年05期

3 胡莉;;中文“词”的语言模型识别研究方法综述[J];北方文学(下半月);2011年03期

4 李玉森;张雪英;袁正午;;面向GIS的地理命名实体识别研究[J];重庆邮电大学学报(自然科学版);2008年06期

5 王海静;;俗语语料库与语典编纂相关问题的思考[J];辞书研究;2011年04期

6 邱金萍;裴雨来;;几种动词义项区分的判定方法[J];滁州学院学报;2009年02期

7 魏顺平;何克抗;;文本智能处理技术在远程教育元研究中的应用[J];中国远程教育;2007年08期

8 魏顺平;;基于文献文本的概念图构建方法——以协作学习领域概念图构建为例[J];中国远程教育;2008年02期

9 魏顺平;;语料库支持下的小学语文阅读环境创设研究[J];电化教育研究;2008年01期

10 马林兵;曹小曙;;空间关系的动态性和模糊性描述[J];地理与地理信息科学;2006年06期

中国重要会议论文全文数据库 前8条

1 段永强;马亚平;王世文;;基于智能模板的文图互生自动转换的研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年

2 林小俊;田浩;王馨浩;杜蕴璇;许敏;吴玺宏;迟惠生;;语言模型训练语料处理方法及解码词典的设计[A];第八届全国人机语音通讯学术会议论文集[C];2005年

3 王斯日古楞;德·萨日娜;那顺乌日图;;现代蒙古语谓语段自动标注系统的设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

4 周学文;郑玉玲;;《元朝秘史》相似人名考[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

5 才华;赵晨星;;藏汉英词汇对照语料库的设计[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

6 陈毅恒;秦兵;刘挺;林建国;李生;;基于错误预测的文本分类方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

7 王东波;陈小荷;年洪东;;有标记联合结构的语言学特征统计分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

8 王花;古丽拉·阿东别克;;基于语料的哈萨克语词频统计的研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

中国博士学位论文全文数据库 前10条

1 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年

2 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年

3 冯文贺;汉语连词及其相关结构的依存分析[D];武汉大学;2011年

4 邓杰;论语言测试效度的辩论方法[D];上海外国语大学;2011年

5 甘瑞瑗;国别化“对外汉语教学用词表”制定的研究:以韩国为例[D];北京语言大学;2005年

6 刘伟;现代汉语代词隐现的动态研究[D];北京语言大学;2005年

7 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年

8 额尔敦朝鲁;面向信息处理的蒙古语动词语义研究[D];内蒙古大学;2005年

9 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年

10 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年

中国硕士学位论文全文数据库 前10条

1 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年

2 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年

3 苏俊峰;基于HMM的藏语语料库词性自动标注研究[D];西北民族大学;2010年

4 阿圆;高校校园网论坛热点话题发现系统的研究与实现[D];昆明理工大学;2009年

5 赵小曼;英汉平行语料库句子级对齐研究及其在机器翻译中的应用[D];安徽大学;2010年

6 戴霖;网络舆情信息挖掘关键技术研究与应用[D];浙江工商大学;2011年

7 徐艳艳;本体技术在协同学习交互信息处理中的应用研究[D];山东师范大学;2011年

8 李芬;双音结构“X以”的词汇化研究[D];华中师范大学;2011年

9 吴金星;蒙古语词法标注语料库的构建及相关技术研究[D];内蒙古大学;2011年

10 包萨仁图雅;蒙古语简单句句法结构树库的建设[D];内蒙古大学;2011年

【相似文献】

中国期刊全文数据库 前10条

1 普布旦增;欧珠;;藏文分词中交集型歧义字段的切分方法研究[J];西藏大学学报(社会科学版);2010年S1期

2 高定国;关白;;回顾藏文信息处理技术的发展[J];西藏大学学报(社会科学版);2009年03期

3 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期

4 扎西加;珠杰;;面向信息处理的藏文分词规范研究[J];中文信息学报;2009年04期

5 关白;;信息处理用藏文分词单位研究[J];中文信息学报;2010年03期

6 李海刚;于洪志;;藏文文本情感分类系统设计[J];甘肃科技纵横;2011年01期

7 才智杰;才让卓玛;;藏文自动分词系统的设计[J];计算机工程与科学;2011年05期

8 江涛;于洪志;徐涛;;互联网藏文内容安全检测过滤系统研究[J];信息网络安全;2009年10期

9 才智杰;;藏文自动分词系统中紧缩词的识别[J];中文信息学报;2009年01期

10 才智杰;;班智达藏文自动分词系统的设计与实现[J];青海师范大学民族师范学院学报;2010年02期

中国重要会议论文全文数据库 前1条

1 才智杰;索南仁欠;;藏文分词算法研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年


  本文关键词:藏文搜索引擎中的分词算法研究,由笔耕文化传播整理发布。



本文编号:457260

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/457260.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12bb3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com