当前位置:主页 > 外语论文 > 英语论文 >

英汉双语术语自动抽取工具效率对比实验报告

发布时间:2023-11-11 13:52
  高效的计算机辅助翻译在很大程度上取决于高质量的翻译记忆库和术语库。双语术语自动抽取是构建大规模双语术语库的关键步骤。探讨双语术语的自动抽取方法、完善现有双语术语自动抽取工具成为计算机辅助翻译研究的重要内容。本研究以“海上安全英汉平行语料库”为实验语料,通过双语术语抽取实验的方法,对目前计算机辅助翻译领域常用的三种英汉双语术语抽取工具SDL Multi Term Extract 2019、Sketch Engine One Click Terms和Synchro Term抽取结果的准确率、召回率和F值进行对比分析。在此基础上,进一步探讨了所抽取术语的翻译方向、术语的长度以及术语在语料库中出现的频率三种因素对每一种工具抽取效率的影响。实验结果表明,三种工具抽取英-汉双语术语的综合效率高于汉-英双语术语。就具体的工具而言,Synchro Term的综合抽取效率最高,SDL Multi Term Extract2019次之,Sketch Engine One Click Terms最低。抽取不同长度和不同频率的双语术语时,Synchro Term整体抽取效果最好,SDL Multi Term ...

【文章页数】:101 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 实验任务介绍
    1.1 实验背景及意义
    1.2 实验任务介绍
第2章 术语及术语抽取研究综述
    2.1 术语及特征
        2.1.1 术语的定义
        2.1.2 术语的基本属性
        2.1.3 术语的结构特征
    2.2 双语术语自动抽取方法
        2.2.1 单语术语抽取
        2.2.2 双语术语对齐
    2.3 术语抽取工具效率对比研究现状
第3章 实验设计
    3.1 实验语料
    3.2 实验工具
        3.2.1 SDL MultiTerm Extract2019
        3.2.2 Sketch Engine OneClick Terms
        3.2.3 SynchroTerm
    3.3 实验步骤
        3.3.1 构建术语标注语料库及双语黄金标准术语表
        3.3.2 基于三种双语术语自动抽取
        3.3.3 实验数据导出
    3.4 实验结果统计
        3.4.1 术语抽取效率评价指标
        3.4.2 实验数据统计
第4章 实验结果与分析
    4.1 双语术语自动抽取总体效率对比
        4.1.1 汉英双语术语自动抽取总体效率对比
        4.1.2 英汉双语术语自动抽取总体效率对比
    4.2 不同长度双语术语自动抽取效率对比
        4.2.1 汉英不同长度双语术语自动抽取效率
        4.2.2 英汉不同长度双语术语自动抽取效率
    4.3 不同频率双语术语自动抽取效率对比
        4.3.1 不同频率的汉英双语术语抽取效率对比
        4.3.2 不同频率的英汉双语术语抽取效率对比
    4.4 自动抽取中双语术语遗漏情况分析
        4.4.1 遗漏术语统计
        4.4.2 遗漏原因分析
第5章 实验总结及反思
参考文献
附录1 SDL MultiTerm Extract2019 双语术语抽取情况
附录2 SynchroTerm双语术语抽取情况
附录3 Sketch Engine OneClick Terms双语术语抽取情况
致谢



本文编号:3862667

资料下载
论文发表

本文链接:https://www.wllwen.com/waiyulunwen/yingyulunwen/3862667.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户45b37***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]