基于目标端双向解码一致性的机器翻译

发布时间：2024-01-30 07:19

　　近年来,随着深度学习技术的迅速发展,基于Seq2Seq的神经网络机器翻译模型(NMT)的性能得到极大的提升,并且在很多语言对上的性能都超过了传统的统计机器翻译模型(SMT)。但不论是基于RNN的Seq2Seq还是基于self-attention的Transformer,它们通常会遇到错误偏置(exposure bias)的问题:在进行解码时容易产生具有良好前缀但不良后缀的不平衡目标。针对这个问题,本文对目标端双向解码进行了研究,并提出了基于目标端双向解码一致性的机器翻译模型。课题研究的主要内容包括以下几部分:(1)目标端双向解码的研究。传统的神经机器翻译模型在进行解码时是基于先前生成的token去预测下一个token。这样早期生成过程中的错误会被保存并传递,影响后续的生成结果。因此,本文提出在解码阶段加入反向解码,并将正向解码和反向解码的候选结果利用联合模型进行重排序,进而实现目标端的双向解码。实验结果表明,目标端双向解码有助于机器翻译任务性能的提高。(2)机器翻译双向一致性解码模型的研究。目标端双向解码模型仅通过重排序从2k-best个候选者中找到最优结果,针对候选者并没有解决exp...

【文章页数】：67 页

【学位级别】：硕士

图1-2神经机器翻译编码器-解码器结构

图1-3带注意力的编码解码框架

图2-1循环神经网络结构

图2-2循环神经网络的展开结构图

本文编号：3889757

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3889757.html

上一篇：ZMJ公司外协生产计划管理系统的设计与实现
下一篇：多业态社区服务平台的研究与应用

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|