基于实体感知强化编码策略的神经机器翻译方法技术

技术编号:46117612 阅读:10 留言:0更新日期:2025-08-15 19:53
本发明专利技术涉及基于实体感知强化编码策略的神经机器翻译方法(EAEE),属于自然语言处理技术领域。在机器翻译任务中,实体的准确翻译对整体翻译质量至关重要,通常要比其他单词更难翻译。现有的方法主要聚焦于标签的融合或者替换,这样会使得模型难以有效挖掘表针实体信息。本发明专利技术基于Transformer模型,在传统编码器‑解码器框架中引入“实体强化编码器”模块。首先通过自注意力编码器生成源语句的全局语义隐向量;其次借助强化编码器与Mask机制协同增强实体语义表征。通过联合优化翻译损失函数与编码器‑解码器双端的实体感知损失函数,约束模型对标记实体的精准感知,该方法在实体翻译准确率与语义连贯性上均优于基线模型。

【技术实现步骤摘要】

本专利技术涉及基于实体感知强化编码策略的神经机器翻译方法,属于自然语言处理。


技术介绍

1、神经机器翻译(nmt)技术能够实现不同语言之间的句子的相互翻译,目前已经取得了巨大的进步。现在大多数研究者专注于提高整体翻译质量。

2、众所周知,句子中的单词并非是同等重要的,通常命名实体(例如:人名、地名、组织机构名)更可能蕴含着关键的语义信息,其翻译的好坏直接影响到机器翻译的质量和准确性,极大的影响着用户体验。表达地点和时间的where和when(10:32am)是句子想要传递的主要信息。此外,专有名词在句子结构上和语义表达上都充当着主干的作用,命名实体信息的挖掘和表征质量已被证明会在很大程度上影响神经机器翻译最终的译文质量。然而,现有研究也表明神经机器翻译模型无法有效提取和表征命名实体信息,极易造成实体词翻译错误的问题,实体翻译的准确性堪忧,这是由于实体与其他词汇被同等对待处理,因此需要强化实体的表征,并在编码过程中给予实体词更多的关注。


技术实现思路

1、本专利技术提供了基于实体感知强化编码策略的神本文档来自技高网...

【技术保护点】

1.基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述方法包括如下:

2.根据权利要求1所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述Step1包括:

3.根据权利要求1所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述Step2包括:

4.根据权利要求1所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述Step2中,翻译模型损失与编码器-解码器双端的实体感知损失包括:

5.根据权利要求2所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述(2)中包括:

...

【技术特征摘要】

1.基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述方法包括如下:

2.根据权利要求1所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述step1包括:

3.根据权利要求1所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述step2包括:

4.根据权利要求1所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述step2中,翻译模型损失与编码器-解码器双端的实体感知损失包括:

5.根据权利要求2所述的基于实体感知强化编码策略的神经机器翻译方法,其特征在于:所述(2)中包括:

6.一种基于实体感知强化编码策略的神经机器翻译系统,...

【专利技术属性】
技术研发人员:余正涛王晓聪李英黄于欣赖华
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1