当前位置:主页 > 科技论文 > 数学论文 >

藏文词同现网络的构建及特征分析

发布时间:2024-03-14 05:30
  语言同现网络用复杂网络技术对语言进行研究,揭示语言的内部结构。文章收集和整理了6个不同载体的藏语语料,包括诗歌、散文、政治、佛教、教材及口语共计64篇文章,在此基础上构建了藏文词同现网络,并从最短路径、聚类系数、度分布等方面分析了藏文词同现网络的统计特征,实验表明藏文词同现网络具有小世界效应和无标度特性。

【文章页数】:6 页

【部分图文】:

图2小语料集上藏文词同现网络的L、C和γ平均值分布图

图2小语料集上藏文词同现网络的L、C和γ平均值分布图

为了从各个方面准确地分析藏文词同现网络的特征,本文将语料按体裁分为诗歌、散文、政治、佛教、教材、口语六大类,诗歌10篇、散文15篇、政治8篇、佛教2篇(因佛教类语料规模较小,故比较时不做考虑)、教材15篇及口语14篇共计64篇大小基本相同的文章。在建立的藏语语料库的基础上,依据藏....


图1藏文词同现网络示意图

图1藏文词同现网络示意图

二阶马尔科夫同现模型构建的词同现网络为G=(V,E),V是节点的集合,E为边的集合。构建规则为词表示同现网络中的节点,同一个句子中两个词之间存在同现关系,则网络中对应的两个节点相连。例3词同现网络特征分析


图3表示大语料集上藏文词同现网络的L、C和γ分布图

图3表示大语料集上藏文词同现网络的L、C和γ分布图

图2小语料集上藏文词同现网络的L、C和γ平均值分布图3.2词同现网络小世界效应和无标度特性


图4双对数坐标下全集语料的度分布图

图4双对数坐标下全集语料的度分布图

复杂网络的度分布P(k)是刻画网络统计性质的另一个重要参数,定义为网络中随机选取一个节点其度恰好为k的概率。若P(k)满足幂律分布:P(k)∝k-γ(γ为正常数),则该网络具备无标度特性。由以上分析可知构建的71个藏文词同现网络的度分布情况,发现该藏文词同现网络与其它语言网络的度....



本文编号:3928132

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/3928132.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户5618b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]