一种通过利用知识融合提高小语种机器翻译准确性的方法技术

技术编号:43827672 阅读:16 留言:0更新日期:2024-12-31 18:28
本发明专利技术提出了一种通过利用知识融合提高小语种机器翻译准确性的方法。属于小语种翻译领域,首先,选取与小语种有较强语言亲缘关系的大语种,进行大量开放语料的预训练;然后,使用半监督学习结合大量未标注小语种数据和小部分已标注小语种数据进行模型训练;训练完成后,进行神经网络修剪,去除不重要参数,使模型更加精简;最后,进行知识蒸馏,通过让小模型复现大模型的行为提高模型效率。本发明专利技术方法提高了小语种翻译的准确性,降低了模型的复杂度,提高了模型的效率,具有较强的实用价值。

【技术实现步骤摘要】

本专利技术属于小语种翻译领域,更具体的说涉及一种通过利用知识融合提高小语种机器翻译准确性的方法


技术介绍

1、由于全球化趋势的推动,跨语言的交流活动日益频繁,机器翻译(machinetranslation,mt)技术受到了广泛的瞩目和研究。在现有的机器翻译技术中,特别是基于神经网络的机器翻译技术,不仅能够实现翻译质量的大幅提高,而且能够有效处理大规模的和复杂的语言对。

2、然而在大语种到小语种的翻译过程中,由于小语种的训练语料相对匮乏,使得机器翻译的性能显著下降。这给涉及小语种的跨语言信息检索、自动文摘、文本分类等任务带来了很大的困难。同时,小语种的机器翻译也面临着输入语句的语法规则复杂,词语意义丰富多变,句法结构灵活多样,情感倾向明显等问题。

3、因此,研究如何提高小语种机器翻译的准确性,尤其是利用已有的大语种资源进行知识迁移,以促进小语种的机器翻译性能的提升,成为了当前的一个重要课题。在此背景下,提出了一种通过半监督学习和知识融合来提高小语种机器翻译准确性的方法。

4、此外,目前的机器学习模型通常复杂度高、参数众多本文档来自技高网...

【技术保护点】

1.一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的方法包括:

2.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的预训练包括:

3.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的进一步训练包括:

4.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的神经网络修剪包括:

5.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的知识蒸馏包括

6....

【技术特征摘要】

1.一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的方法包括:

2.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的预训练包括:

3.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的进一步训练包括:

4.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的神经网络修剪包括:

5.根据权利要求1所述的一种通过利用知识融合提高小语种机器翻译准确性的方法,其特征在于:所述的知识蒸馏包括:

6.根据权利要求5所述的一种通过利用...

【专利技术属性】
技术研发人员:李鹏
申请(专利权)人:中译语通科技昆明有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1