● 内容详情
随着信息时代的快速发展,术语翻译作为术语学的研究热点之一,广泛应用于跨语言信息检索、机器翻译和双语词典编撰等领域。通过对国内外相关技术的调研,提出了英汉术语自动翻译所需研究的关键技术。本文首先通过对搜集双语语料库中的大量名词性术语进行分析,对英语源语言术语进行调序,然后利用现有统计翻译工具摩西(Moses)进行统计训练并获得多个候选译文,最后对获得的多个候选结果进行重新打分,得到最佳译文。本文主要研究工作包括:针对英汉术语在语序、语态、语法等语言学上的特点不同,提出了一种基于中心词驱动的术语机器翻译方法。通过大量的对比分析发现,英汉术语中语序的差别具有一定的规律性,而语序的预先调整同时也为候选译文选词时提供较好的上下文语境。本文以术语中心词为调序依据,建立名词短语(Noun Phrase)调序模式库,在翻译之初预先对源语言术语进行语序调整。对于已有语序模型不能覆盖的英语术语语序,采用一定的手段进行泛化调序。对于摩西统计翻译得到的多个候选翻译结果,通过人工对比校对可以发现,最佳译文并非一定是摩西得分最高的候选结果。因此本文对统计翻译的候选译文重新进行加权打分。通过利用语素间的互信息特征,即通过计算候选译文中修饰语之间以及修饰语与中心词的关联程度,同时结合候选译文的语言模型及统计翻译的打分结果进行综合评定,以选取最佳翻译结果。通过对比分析可以看出,本文的方法对于英汉科技语料中术语的自动翻译具有较好的效果,其翻译结果优于摩西等统计机器翻译工具。