一种中英自动翻译模型训练方法及系统技术方案

技术编号:41905412 阅读:32 留言:0更新日期:2024-07-05 14:10
本申请涉及一种中英自动翻译模型训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将存储有正样本的正样本库作为第一训练样本集,对原始翻译模型进行训练以获取一阶翻译模型;将存储有负样本的负样本库与第一训练样本集中随机部分正样本作为第二训练样本集,对一阶翻译模型进行训练以获取二阶训练模型;从所述第二训练样本集中随机抽取若干个样本对二阶训练模型进行复现测试,并计算翻译概率;判断翻译概率是否大于预设概率阈值;若是,则结束训练。

【技术实现步骤摘要】

本申请涉及机器翻译,特别是涉及一种中英自动翻译模型训练方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、随着全球化的发展,国际交流及信息传递呈现爆发式增长。传统的依赖于人工翻译的方法已经无法满足人们日常跨语言交流的需求。而机器翻译作为一种能自动提供准确翻译结果的技术,逐渐得到广泛的关注和研究。从传统的基于规则的翻译方法到统计机器翻译方法,再到现在主流的神经机器翻译方法,机器翻译的性能已经取得了巨大的进展。

2、公开号为us20090164206a1公开了一种用于训练基于双语语料库的目标语言单词屈折变化模型的方法,该方法包括建立初始tlwi模型,对源语言语料库和目标语言语料库进行预处理,提取包含tlwi信息的模式,基于预处理的源语言语料库和目标语言语料库,利用模式训练tlwi模型。

3、但是通过该方法对语言模型进行训练时,需要人工获取大量的正样本以及负样本,才能完成性能指标达到要求的机器翻译模型,导致训练成本高。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种本文档来自技高网...

【技术保护点】

1.一种中英自动翻译模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的中英自动翻译模型训练方法,其特征在于,所述将存储有正样本的正样本库作为第一训练样本集,对原始翻译模型进行训练以获取一阶翻译模型包括:

3.根据权利要求2所述的中英自动翻译模型训练方法,其特征在于,所述第一匹配度的计算方法包括:

4.根据权利要求2所述的中英自动翻译模型训练方法,其特征在于,所述第二匹配度的计算方法包括:

5.根据权利要求1至4任意一项所述的中英自动翻译模型训练方法,其特征在于,所述方法还包括:

6.一种中英自动翻译模型训练系统,...

【技术特征摘要】

1.一种中英自动翻译模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的中英自动翻译模型训练方法,其特征在于,所述将存储有正样本的正样本库作为第一训练样本集,对原始翻译模型进行训练以获取一阶翻译模型包括:

3.根据权利要求2所述的中英自动翻译模型训练方法,其特征在于,所述第一匹配度的计算方法包括:

4.根据权利要求2所述的中英自动翻译模型训练方法,其特征在于,所述第二匹配度的计算方法包括:

5.根据权利要求1至4任意一项所述的中英自动翻译模型训练方法,其特征在于,所述方法还包括:

6....

【专利技术属性】
技术研发人员:赵惠吕壮吕遥
申请(专利权)人:广东科贸职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1