当前位置:主页 > 科技论文 > 软件论文 >

基于混合策略的藏汉人名音译模型研究

发布时间:2022-12-05 08:18
  音译作为一种按照文字读音进行近似翻译的方法,在人名翻译中有着广泛的应用。人名音译接受一个源语言的人名作为输入,在保证发音基本不变的原则下,输出与该人名以目标语言表示的翻译。在许多应用中,例如实体翻译,语料库对齐,跨语言信息检索,信息提取和自动词典获取等任务中,命名实体的音译是必不可少的子任务,而人名音译是命名实体音译的重要组成部分。本文通过基于字素的藏汉人名音译模型研究,总结出资源较少语言在音译时的不足,提出了“先确定发音,再确定字型”的音译策略,并通过线性组合和利用发音信息重排序的策略对候选音译对进行重排序。本文的主要工作和贡献点如下:1.本文首先介绍了基于形素的藏汉人名音译框架,并在该框架下分析比较了两种音译模型:联合信源信道模型和条件随机场模型。在联合信源信道模型中,我们介绍了藏汉人名音译模型在基于形素的前提下如何进行切分对齐,并介绍了生成多个候选音译对所使用的Beam Search算法,然后通过分析输出的中间参数,根据二元音译对,一元音译对,源语言音节和目标语言音节之间的关系,找到了对应关系矩阵稀疏的原因部分是因为汉字中的多音字现象,为后面的工作做了铺垫。在条件随机场模型中,我... 

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 背景与意义
    1.2 国内外研究现状
        1.2.1 音译的方法
        1.2.2 音译的模型方法
        1.2.3 评价指标
        1.2.4 候选音译对重排序的方法
        1.2.5 藏汉人名音译现状
    1.3 本文主要研究内容
第二章 基于形素的藏汉人名音译模型
    2.1 切分对齐
        2.1.1 藏汉人名音译对的切分
        2.1.2 藏汉人名音译对的对齐
    2.2 基于联合信源信道模型的藏汉人名音译
        2.2.1 联合信源信道模型原理
        2.2.2 模型的生成
        2.2.3 音译
    2.3 基于条件随机场的藏汉人名音译
    2.4 实验
        2.4.1 实验语料
        2.4.2 评价指标
        2.4.3 实验结果
        2.4.4 结果分析
    2.5 本章小结
第三章 基于音素的藏汉人名音译模型
    3.1 藏文到拉丁转写
    3.2 拉丁转写到拼音
        3.2.1 切分对齐
        3.2.2 模型方法
        3.2.3 实验
    3.3 拼音到汉字模型
        3.3.1 使用的模型方法
        3.3.2 候选音译对的生成
        3.3.3 实验
    3.4 本章小结
第四章 候选音译对的重排序
    4.1 重排序的原理
        4.1.1 基于不同切分粒度的候选音译对重排序
        4.1.2 基于不同音译模型的候选音译对的重排序
    4.2 重排序的方法
        4.2.1 线性组合
        4.2.2 利用发音信息重排序
    4.3 实验
        4.3.1 实验语料
        4.3.2 评价指标
        4.3.3 结果
        4.3.4 结果分析
    4.4 本章小结
第五章 总结与展望
参考文献
致谢
攻读学位期间发表的学术论文目录



本文编号:3710031

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3710031.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户4c18a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]