一种基于大语言模型的多层级译文术语干预方法技术

技术编号:40712801 阅读:29 留言:0更新日期:2024-03-22 11:15
本发明专利技术具体涉及一种基于大语言模型的多层级译文术语干预方法,该多层级译文术语干预方法包括步骤:用户选择术语库并确定原文列表,调用大语言模型能力,整合术语得到整合后的术语列表,对整合后的术语列表进行多层级术语干预,得到新译文,多层级术语干预包括最高层级术语干预、中间层级术语干预和最低层级术语干预,最高层级术语干预直接端到端地干预术语生成译文,不做中间环节的处理,中间层级术语干预使用对齐能力和语法修正能力,获得流程结果,最低层级术语干预指原文替换后重新翻译。本发明专利技术的多层级译文术语干预方法在翻译工作的任何流程节点都可以接入术语干预,能够改善机器翻译术语的质量,提高其可控性。

【技术实现步骤摘要】

本专利技术属于机器翻译,涉及一种基于大语言模型的多层级译文术语干预方法


技术介绍

1、在专业语言服务场景中,不同的翻译模型翻译的结果差异较大,导致译后编辑工作量出入较大。现有技术中,使用占位符在机器翻译输入时替换需要干预的术语,机器翻译输出译文后用对应的术语替换占位符的译文。该方法主要的问题是:1)仅能在进行机器翻译任务时使用,对已有的译文或者人工译文难以适用,或适用会造成更多问题;2)术语占位符的译文不确定,翻译模型并不必然原样保留占位符(如<per001>变成了per1),在面对多个术语都需要干预时,无法正确区分不同的占位符;3)无法适配语法,即缺乏正确的屈折变化,因为最终的术语应用通过直接替换完成,其形式并不能适配语境。这对于高屈折度的语言而说是难以接受的(比如西班牙语laprofesora→la maestra而不是maestro),反而增加了译员的负担。

2、把原文中的术语替换成希望的译文,由机器翻译复制并作出适当修改。这过度依赖模型的能力,并非所有机器翻译引擎对所有语向都可以正确复制并修改形式。该方法对翻译引擎要求过高本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的多层级译文术语干预方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,还包括文档的预处理:

3.根据权利要求2所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,对所述整合后的术语列表,取原文部分在所述原文列表S中匹配,得到每个原文Si对应的术语对Ti,并逐个遍历{Si,Ri,Ti}进行术语干预,跳过所述术语对Ti为空的位置,在所述最高层级术语干预和所述中间层级术语干预设置有干预失败的检测,如果检测到干预失败,进入重试机制或者下一层级术语干预。>

4.根据权利...

【技术特征摘要】

1.一种基于大语言模型的多层级译文术语干预方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,还包括文档的预处理:

3.根据权利要求2所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,对所述整合后的术语列表,取原文部分在所述原文列表s中匹配,得到每个原文si对应的术语对ti,并逐个遍历{si,ri,ti}进行术语干预,跳过所述术语对ti为空的位置,在所述最高层级术语干预和所述中间层级术语干预设置有干预失败的检测,如果检测到干预失败,进入重试机制或者下一层级术语干预。

4.根据权利要求2所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,所述双语列表...

【专利技术属性】
技术研发人员:薛景元姜征李光华
申请(专利权)人:甲骨易北京语言科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1