当前位置:主页 > 文艺论文 > 语言艺术论文 >

融合语言特征的印度英语-汉语神经机器翻译研究

发布时间:2021-12-12 12:05
  随着互联网以及信息技术的飞速发展,人工智能领域越来越受到人们的重视,吸引了大批的研究人员和开发人员。机器翻译是人工智能领域研究的热点,具有重要的理论意义和极大的应用价值。本文研究旨在探究如何构建印度英语-汉语的双语语料库,如何在通用英语-汉语神经机器翻译模型基础上通过迁移学习训练印度英语-汉语神经机器翻译模型,如何把印度英语的语言特征与神经网络结合起来,如何设计并实现印度英语-汉语的神经机器翻译系统。针对上述问题,本文的主要工作如下:1、社交媒体印度英语语料的获取。印度英语是一种典型的英语变体,受到印度历史、地理、政治、经济、文化等多方面影响而带有显著的区别性特征,尤其是自然口语风格的社交媒体语言,所以我们选取了一些社交媒体网站,通过爬虫程序获取网页上的文本,再把文本处理之后得到语料。2、印度英语语言特征的研究。印度英语与美国英语、英国英语有所不同,有自己的一些语言特征,要把语言特征和神经网络很好地结合起来,就必须深入研究印度英语的语言特征,抓住了印度英语的语言特征,才有可能把语言特征融入到神经网络中,从而改善神经机器翻译模型的性能,提高译文的质量。3、迁移学习的运用。与国际性的美国英... 

【文章来源】:战略支援部队信息工程大学河南省

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

融合语言特征的印度英语-汉语神经机器翻译研究


机器翻译金字塔RBMT方法能够直接表达语言学的知识,能够很好地从语言学的角度去解释机器翻译的运

示意图,循环神经网络,机器翻译,模型


图 2.2 循环神经网络,左图是 RNN 模型未展开的示意图,展开后呈右图所示。RNN 一共有三层入层,也就是 x,第二层是隐藏层也就是 h,第三层是输出层 o。对于展开后的示其中的符号解释如下: 是在 t 时刻训练样本的输入。 是在 t 时刻模型的隐藏状态, 由 和 共同决定。 是在 t 时刻模型的输出, 只由模型当前的隐藏状态 决定。 是在 t 时刻模型的损失函数。 是在 t 时刻的训练输出。U,W,V 这三个矩阵是模型的线性关系参数。多种技术混合以及改进翻译的主流技术主要有基于规则的机器翻译技术,基于实例的机器翻译技术机器翻译技术以及基于神经网络的机器翻译技术。从近几年机器翻译的发展一个技术单独用于机器翻译系统的做法十分少见,如果我们对我们构建机器翻较高,那么我们就应该结合其中两种或两种以上机器翻译技术来构建机器翻

短语结构树,机器翻译


树的机器翻译方法,其二是基于依存树的机器翻译方法。短语结构树的机器翻译方法首先是建立了短语结构语法树,模型在翻译的结构语法树作为外部知识引入模型中,从而完成翻译。基于短语结构树的到串的机器翻译模型为主,这种模型的复杂度比较低,只需要某一端的语这对于一些缺乏句法分析的语言来说无疑是一件好事。例如我们想做一个的机器翻译系统,那么在我们构建机器翻译时,是不需要对这些小语种做因为我们对英语的句法分析已经足够多了。基于树到串模型的机器翻译模比较突出,译文质量也相对较好。于依存树的机器翻译方法在词与词之间建立了依存关系,模型在翻译时把并完成翻译,翻译的过程不仅关注统计的概率,也关注词与词之间的句法加了模型的知识,使得模型在翻译时不再只是从概率去翻译句子。和短语依存语法从依存的角度对句子进行分析,对句子的分析更深入、更完整,译。

【参考文献】:
期刊论文
[1]融合单词翻译的神经机器翻译[J]. 韩冬,李军辉,周国栋.  中文信息学报. 2019(07)
[2]印度英语特征研究[J]. 唐小宝.  海外英语. 2019(02)
[3]基于RNN的中文二分结构句法分析[J]. 谷波,王瑞波,李济洪,李国臣.  中文信息学报. 2019(01)
[4]基于神经网络的维汉翻译系统实现[J]. 张胜刚,艾山·吾买尔,吐尔根·依布拉音,买合木提·买买提,米尔夏提·力提甫.  现代电子技术. 2018(24)
[5]基于注意力卷积的神经机器翻译[J]. 汪琪,段湘煜.  计算机科学. 2018(11)
[6]机器翻译技术的研究和发展[J]. 王子航.  电子制作. 2018(22)
[7]基于LSTM的蒙汉机器翻译的研究[J]. 刘婉婉,苏依拉,乌尼尔,仁庆道尔吉.  计算机工程与科学. 2018(10)
[8]基于门控循环神经网络词性标注的蒙汉机器翻译研究[J]. 刘婉婉,苏依拉,乌尼尔,仁庆道尔吉.  中文信息学报. 2018(08)
[9]基于RNN和CNN的蒙汉神经机器翻译研究[J]. 包乌格德勒,赵小兵.  中文信息学报. 2018(08)
[10]RNN编码器-解码器在维汉机器翻译中的应用[J]. 帕丽旦·木合塔尔,吾守尔·斯拉木,买买提阿依甫,努尔麦麦提·尤鲁瓦斯.  计算机工程与应用. 2018(15)

博士论文
[1]融合结构信息的神经机器翻译模型研究[D]. 王星.苏州大学 2018
[2]基于神经网络的句法分析研究[D]. 周浩.南京大学 2017

硕士论文
[1]融合翻译知识的汉越神经机器翻译研究与实现[D]. 王卓.昆明理工大学 2018
[2]基于深度学习的汉语句法分析研究[D]. 王冰.杭州电子科技大学 2018
[3]基于深度学习的自然语言句法分析研究[D]. 周青宇.哈尔滨工业大学 2016
[4]基于深度学习的汉语词义消歧方法研究[D]. 张晶莹.黑龙江大学 2016
[5]基于循环神经网络的依存句法分析模型研究[D]. 张俊驰.湖北大学 2016
[6]基于卷积神经网络的深度学习算法与应用研究[D]. 陈先昌.浙江工商大学 2014



本文编号:3536646

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/3536646.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18ed3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com