蒙古国新闻语料库的构建及相关问题研究

发布时间:2018-01-08 22:31

  本文关键词:蒙古国新闻语料库的构建及相关问题研究 出处:《内蒙古大学》2016年博士论文 论文类型:学位论文


  更多相关文章: 蒙古语语料库 新闻 西里尔文字 蒙古语正字法 软件


【摘要】:语料库是按照一定的原则收集和组织的真实的自然语言作品的集合。蒙古语己构建《1000万词级的现代蒙古语语料库》,其加工方面己涉及到词法、句法、语义的各个层面。本研究在蒙古国出版发行的新闻稿件基础上构建了蒙古国新闻语料库,并对新闻语料库的语言和应用方面进行了研究,最后研发了应用于计算语言学各类研究的语料库管理程序。论文的具体内容包括:引言部分,介绍了本文的研究情况和研究背景,研究目的、方法的创新点以及研究意义。第一章论述了应用于蒙古文信息处理和新闻语言研究的蒙古国新闻语料库的构建方法和过程。本文在介绍蒙古语语料库的基本情况、发展历程以及基于蒙古文信息处理的大规模语料库的构建情况、分类和实用价值的基础上阐述了本研究收集蒙古国新闻语料,并对其进行分类的方法和过程。第二章,主要研究了蒙古国新闻语料库的语言和语用情况,包括新闻语言应用的具体情况和语言应用的主要特点;归纳蒙古国新闻语料库中遵循的蒙古语正字法规则及主要出错的原因,并用例子说明了该问题。第三章,介绍了针对本研究研发的软件,针对语料库的构建和加工,便于文字搜索的字频统计软件以及针对用户的多功能搜索程序。
[Abstract]:The corpus is a collection of real natural language works collected and organized according to certain principles. Mongolian has constructed a modern Mongolian corpus of < 10 million words, which involves lexical and syntactic aspects. On the basis of the news articles published in Mongolia, this study constructs the Mongolian news corpus, and studies the language and application of the news corpus. Finally, we develop a corpus management program which is applied to all kinds of research in computational linguistics. The specific contents of this paper are as follows: introduction, introducing the research situation and background of this paper, and the purpose of the research. The first chapter discusses the construction method and process of Mongolian news corpus used in Mongolian information processing and news language research. This paper introduces the basic situation of Mongolian corpus. . The course of development, the construction of large-scale corpus based on Mongolian information processing, the classification and practical value of this study on the basis of the collection of Mongolian news corpus. The second chapter mainly studies the language and pragmatics of Mongolian news corpus, including the specific situation of news language application and the main characteristics of language application; The Mongolian orthography rules followed in the Mongolian News Corpus and the main reasons for the errors are summarized. Chapter three introduces the software developed for this study. For the construction and processing of corpus, the word frequency statistical software and the multifunctional search program for users are convenient for text search.
【学位授予单位】:内蒙古大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:H531

【相似文献】

相关期刊论文 前10条

1 高·照日格图;辨别蒙古语中借词的一些方法[J];内蒙古大学学报(人文社会科学版);2000年01期

2 方龄贵;元明戏曲中的蒙古语续考(连载)[J];西北民族研究;2001年01期

3 方龄贵;元明戏曲中的蒙古语续考(连载)[J];西北民族研究;2001年03期

4 张双福;论蒙古语元音的阳性向阴性演化——兼谈土默特部名称的演变[J];蒙古学信息;2001年02期

5 H.Б.巴德加耶夫 ,范丽君;蒙古语中的塞擦音銼[J];蒙古学信息;2001年03期

6 贾拉森;再论蒙古语和藏语某些格形式比较[J];内蒙古大学学报(人文社会科学版);2002年05期

7 孟和宝音;蒙古语圆唇元音演变轨迹[J];内蒙古师范大学学报(哲学社会科学版);2002年01期

8 包双喜;元杂剧蒙古语词小议[J];民族语文;2002年02期

9 华沙宝;蒙古语短语标注策略[J];中央民族大学学报;2003年05期

10 贾f^儒;关于蒙古语状语的几个问题的讨论[J];青海民族研究;2004年01期

相关会议论文 前10条

1 雪艳;那顺乌日图;;蒙古语连续多词单元的识别和标注[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

2 山丹;;蒙古语标准音水平测试系统设计构思[A];第九届中国语音学学术会议论文集[C];2010年

3 胡阿旭;格根塔娜;吕士良;于洪志;;肃北蒙古语复元音研究[A];第九届中国语音学学术会议论文集[C];2010年

4 敖敏;;蒙古语肃北土语单词韵律模式初探[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

5 包桂兰;哈斯其木格;呼和;;蒙古语清擦音实验研究[A];第九届中国语音学学术会议论文集[C];2010年

6 胡红彦;哈斯其木格;呼和;;蒙古语边音/l/实验研究[A];第九届中国语音学学术会议论文集[C];2010年

7 哈斯其木格;郑玉玲;呼和;包桂兰;胡红彦;;蒙古语语音动态腭位数据库[A];第九届中国语音学学术会议论文集[C];2010年

8 高娃;;蒙古语领属范畴在满语中的表现形式[A];中国民族语言学会第10届学术讨论会摘要集[C];2010年

9 呼和;;蒙古语实验语音学发展历程及最新成果介绍[A];中国民族语言学会第10届学术讨论会摘要集[C];2010年

10 胡红彦;哈斯其木格;呼和;;蒙古语/m/辅音实验研究[A];中国民族语言学会第10届学术讨论会摘要集[C];2010年

相关重要报纸文章 前10条

1 记者 塔娜;深化蒙古语术语规范化标准化研究[N];中国社会科学院院报;2007年

2 郝文婷;内蒙古对蒙古语授课师范生实行免费教育[N];中国教育报;2007年

3 郝文婷;内蒙古对蒙古语师范生免费教育[N];西部时报;2007年

4 实习记者 格根哈斯;市场需求促我市形成学习新蒙古语热[N];呼和浩特日报(汉);2007年

5 本报记者 李霞 通讯员 包图娅;走向世界的蒙古语[N];内蒙古日报(汉);2008年

6 记者 石向军 通讯员 百音;全国首个蒙古语服务信息平台投入使用[N];内蒙古日报(汉);2010年

7 杨晓红 朱丹林;梅力更召,延续300年的蒙古语诵经[N];中国民族报;2011年

8 本报记者  阿勒得尔图;卜·图力更:实现现代蒙古语规范与标准化的人[N];中国民族报;2006年

9 勿日汗;汉语蒙古语“血缘”很近,同源率94%[N];新华每日电讯;2008年

10 张玉天;我盟出台蒙古语授课学前教育补助暂行办法[N];锡林郭勒日报;2008年

相关博士学位论文 前10条

1 孟和吉雅;蒙古语标准音水平测试系统研究[D];内蒙古大学;2010年

2 包满亮;蒙古语构形词缀研究[D];中央民族大学;2007年

3 孟将;中古蒙古语和蒙古语族语言的格形态比较研究[D];中央民族大学;2012年

4 青林;蒙古语文学文献及“三共身”研究[D];内蒙古大学;2012年

5 铁梅;蒙古语科尔沁土语语音声学分析[D];内蒙古大学;2015年

6 恩和巴雅尔;蒙古国新闻语料库的构建及相关问题研究[D];内蒙古大学;2016年

7 王海凤;蒙古语熟语研究[D];内蒙古大学;2010年

8 海银花;面向信息处理的蒙古语名词语义研究[D];内蒙古大学;2010年

9 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年

10 格根哈斯;蒙古语科尔沁土语特殊词汇研究[D];中央民族大学;2011年

相关硕士学位论文 前10条

1 乌吉木;蒙古语青海和硕特土语的特殊词语研究[D];内蒙古师范大学;2008年

2 吉木色;梅日更召蒙古语法会研究[D];内蒙古师范大学;2008年

3 白乌兰图雅;蒙古语电视与观众互动关系的社会学分析[D];内蒙古师范大学;2008年

4 白玉红;关于蒙古语的使用情况[D];内蒙古大学;2009年

5 秀梅;蒙古语不稳定“√‘n’”研究[D];内蒙古师范大学;2009年

6 敖云那生;蒙古语青海土语中的词法形式体系[D];西北民族大学;2009年

7 邰利明;满语中的蒙古语借词[D];黑龙江大学;2010年

8 马丽萍;蒙古语网络语言初探[D];内蒙古大学;2010年

9 萨如拉;蒙古语市面语言应用研究[D];内蒙古师范大学;2010年

10 陈玉荣;蒙古语熟语中的文化积淀[D];内蒙古师范大学;2010年



本文编号:1398970

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/rwkxbs/1398970.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户269ec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com