一种视频辅助的多模态机器翻译方法及系统技术方案

技术编号:41730404 阅读:17 留言:0更新日期:2024-06-19 12:52
本发明专利技术涉及多模态融合技术领域,具体为一种视频辅助的多模态机器翻译方法,该方法包括如下步骤:构建多模态翻译模型结构,并通过超参数和随机变量对所述多模态翻译模型初始化;获取多模态数据集,所述多模态数据集包括视频与双语平行语料;依据所述多模态数据集对所述多模态翻译模型结构进行训练,以获得多模态翻译模型的最佳参数;通过所述最佳参数获得目标多模态翻译模型,并获得最佳翻译结果。本发明专利技术通过跨模态注意力机制和门控机制来构建多模态翻译模型,能够深入挖掘视频与文本之间的语义关联,实现深层次的语义融合,能够更准确地传达信息,显著提升机器翻译结果的准确率。

【技术实现步骤摘要】


技术介绍

1、随着全球化进程的不断加速,多模态机器翻译技术在跨语言交流中发挥着重要作用。传统的机器翻译方法主要基于文本信息,忽略了视觉信息的利用。但是在实际交流中,非文本信息例如面部表情、手势、语调等,对于准确理解语义具有重要意义。现有多模态翻译模型中,对视频和文本信息往往独立处理,缺乏有效的融合机制,无法充分利用视频中丰富的视觉信息;对于视频信息的处理不够充分,无法有效利用视频中丰富的视觉信息;同时缺乏大规模、高质量的多模态数据集合限制了多模态翻译技术的发展。

2、为了解决现有翻译技术模态间信息融合不充分、注意力机制局限性以及数据标注成本高等问题,需要对多模态机器翻译方法进行优化,以实现视频与文本的深度融合,提高翻译结果的准确性和流畅性,为多模态翻译技术的发展提供有力支持。


技术实现思路

1、针对现有方法的缺陷以及实际应用的不足,本专利技术为了深入挖掘视频与文本之间的语义联系,实现深层次的语义融合,更准确地传达信息使得翻译结果更加准确和流畅,提升多模态机器翻译结果的准确率,为多模态翻译技术的发本文档来自技高网...

【技术保护点】

1.一种视频辅助的多模态机器翻译方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的视频辅助的多模态机器翻译方法,其特征在于,所述构建多模态翻译模型结构包括:

3.根据权利要求2所述的视频辅助的多模态机器翻译方法,其特征在于,所述建立文本引导视觉特征函数包括:

4.根据权利要求3所述的视频辅助的多模态机器翻译方法,其特征在于,所述文本引导视觉特征函数,满足如下关系:

5.根据权利要求2所述的视频辅助的多模态机器翻译方法,其特征在于,所述建立文本-视觉特征融合函数包括:

6.根据权利要求5所述的视频辅助的多模态机器翻译方法,...

【技术特征摘要】

1.一种视频辅助的多模态机器翻译方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的视频辅助的多模态机器翻译方法,其特征在于,所述构建多模态翻译模型结构包括:

3.根据权利要求2所述的视频辅助的多模态机器翻译方法,其特征在于,所述建立文本引导视觉特征函数包括:

4.根据权利要求3所述的视频辅助的多模态机器翻译方法,其特征在于,所述文本引导视觉特征函数,满足如下关系:

5.根据权利要求2所述的视频辅助的多模态机器翻译方法,其特征在于,所述建立文本-视觉特征融合函数包括:

6.根据权利要求5所述的视频辅助的多模态机器翻译方法,其特征在于,所述文本-视觉特征融合函数,满足如下关系:

7.根据权利要求2所述的视频辅助的...

【专利技术属性】
技术研发人员:赵静司雨蒙孙仕亮
申请(专利权)人:华东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1