论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 机器翻译的不可行性英语论文 机器翻译论文

关于机器翻译论文范文 基于词形分析的汉—维机器翻译性能分析相关论文写作参考文献

分类:论文范文 原创主题:机器翻译论文 更新时间:2024-02-12

基于词形分析的汉—维机器翻译性能分析是关于机器翻译方面的论文题目、论文提纲、机器翻译论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

摘 要:隨着我国“一带一路”战略的推进,新疆应当充分发挥其区域优势,着力于打造丝绸之路经济带核心区,其中提高汉语 - 维吾尔语(汉-维)之间机器翻译的质量有着重要的现实意义.通过对低频维吾尔语词汇进行词干词缀分割进行了基于三种不同机器翻译系统的汉-维机器翻译对比实验.该方法不仅减少词汇表大小从而减轻未登录词(Out Of Vocabulary,OOV)问题,同时也大大提升了翻译结果.其中统计机器翻译结果提升最明显,比原始提升了3.29个BLEU值.

关键词: 汉-维机器翻译; 词干词缀; 统计机器翻译; 神经机器翻译; 加强记忆翻译

中图分类号:TP391.2 文献标识码:A 文章编号:1009-3044(2018)11-0172-03

Morphological Analysis and its Effects in Chinese and Uyghur Machine Translation

Gulnigar MAHMUT,Parida TURSUN,Askar HAMDULLA

(Xinjiang University School of Information Science and Engineering, Urumqi 830046, China)

Abstract:As China"s "The Belt and Road" (B&R)strategy advances, Xinjiang should gives full play to its regional advantages and strives to create the core area of the Silk Road Economic Belt. Therefore, it is of great practical significance to improve the quality of machine translation between Chinese and Uyghur. In this paper, a comparison experiment of Chinese-Uyghur Machine Translation based on three different machine translation systems are carried out, by separating the stems and affixes of low-frequency Uyghur vocabulary. This method not only reduces the size of the vocabulary table and alleviates the problem of Out Of Vocabulary (OOV), but also greatly enhances the translation result. Among them, statistical machine translation results are the most obvious, with 3.29 more BLEU scores than the original.

Key words:Chinese and Uyghur Machine Translation; steam affix; Statistical Machine Translation; Neural Machine Translation; Memory augmented Neural Machine Translation

自2014年,神经机器翻译(Neural Machine Translation,NMT)作为一种新的机器翻译方法受到了广泛关注.神经机器翻译的核心思想是用一个神经网络(称之为编码器,Encoder)将源语言句子编码为一个稠密向量,然后再用另一个神经网络(称之为解码器,Decoder)把该向量表示转化为目标语言句子.基于长短时记忆(Long Short Term Memory,LSTM)的循环神经网络(Recurrent Neural Network,RNN)能够有效处理长距离依赖,相比于传统的统计机器翻译(Statistical Machine Translation,T),有效缓解了数据稀疏问题.因此NMT的翻译性能在很多语言对上明显优于T.然而,NMT高度依赖大规模高质量的双语数据.目前,像英语、汉语等大语种语料库的建设已经比较成熟,而像维吾尔语这样的小语种可用语言资源较少.

随着国家“一带一路”战略的深入,针对汉-维的机器翻译也成了一个热点问题.研究汉-维间机器翻译具有重要的经济价值,社会价值和理论价值.

1 相关工作

在众多研究者们的共同努力下,汉-维机器翻译的准确率在不断提升.针对从维吾尔语到汉语的翻译,Kong J等人提出了一种使用指针(pointers)的神经机器翻译方法来处理罕见词(rare words)和未登录词(unknown words,UNK),并且该方法可用于所有的神经机器翻译[1].哈里旦木等人从词粒度层面出发,首次将6种不同的神经机器翻译方法用在同一个语料库,即维-汉语料库上进行了对比分析.该研究对维-汉NMT的进一步研究有很重要的参考意义[2].针对汉语到维吾尔语的翻译,目标端为黏着语带来的挑战导致相关研究较少.米莉万等人在论文[3]中利用Cherio搭建了一个基于层次短语的汉维统计机器翻译系统,分析探讨了不同粒度对汉维统计机器翻译系统的影响;在文献[4]中依据维吾尔语黏着性提出了一种基于有向图的维吾尔语“词干-词缀”语言模型.Zhang S等人采用记忆加强(memory-augmented)的方式进行了汉-维、维-汉机器翻译,实验结果显示汉-维翻译BLEU得分不如维-汉翻译.可见汉-维机器翻译需要进一步研究和发展.

总结:该文是关于机器翻译论文范文,为你的论文写作提供相关论文资料参考。

参考文献:

1、 熟练维汉双语者在语言理解中的语言切换 摘 要:目的:熟练维-汉双语者维汉两种语言的语言切换及其代价。方法:采用词汇判断范式,考察非切换、预期切换和非预期切换三种任务条件下维吾尔语、汉。

2、 汉维烹饪动词语义场对比分析 摘 要:本文在语义学及对比语言学的理论下研究汉语和维吾尔语烹饪动词语义场的相同和不同,以及两者词化程度进行对比分析。结论显示两种语言存在一些烹饪。

3、 葛维汉西南宗教视野下的羌民宗教 [摘要]20世纪上半叶葛维汉对中国西南及羌民宗教研究的论述,体现了葛维汉从传教士转变为人类学家后其宗教研究的学术理念。同时,葛维汉对羌民宗教的研。

4、 1933年葛维汉因江口考古事件写给汉口美国领事馆两封信 信一尊敬的先生:几天前我的夫人给你们发了一封航空邮件。 看起来我应该向你们提供一份完整和准确的报告,说明真实情况和事件发生的场景。去年我和。

5、 基于类型化认知的维汉关系 维吾尔族和汉族都会习惯性地利用它已有的认识框架或库存知识来认识和理解周围的新事物。在类型化认知的基础上,维汉双方根据已有文化知识的不同,无意识地。

6、 硅谷死敌玛格丽特·维斯塔格:并购审查重点关注大数据垄断 因一系列针对科技巨头公司的处罚,欧盟委员会竞争专员玛格丽特·维斯塔格被称为西方世界最有权力的反垄断者、欧盟竞争秩序的“守护者”和大公司“死对头”。