【技术实现步骤摘要】
本专利技术属于机器翻译,涉及一种基于大语言模型的多层级译文术语干预方法。
技术介绍
1、在专业语言服务场景中,不同的翻译模型翻译的结果差异较大,导致译后编辑工作量出入较大。现有技术中,使用占位符在机器翻译输入时替换需要干预的术语,机器翻译输出译文后用对应的术语替换占位符的译文。该方法主要的问题是:1)仅能在进行机器翻译任务时使用,对已有的译文或者人工译文难以适用,或适用会造成更多问题;2)术语占位符的译文不确定,翻译模型并不必然原样保留占位符(如<per001>变成了per1),在面对多个术语都需要干预时,无法正确区分不同的占位符;3)无法适配语法,即缺乏正确的屈折变化,因为最终的术语应用通过直接替换完成,其形式并不能适配语境。这对于高屈折度的语言而说是难以接受的(比如西班牙语laprofesora→la maestra而不是maestro),反而增加了译员的负担。
2、把原文中的术语替换成希望的译文,由机器翻译复制并作出适当修改。这过度依赖模型的能力,并非所有机器翻译引擎对所有语向都可以正确复制并修改形式。该方
...【技术保护点】
1.一种基于大语言模型的多层级译文术语干预方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,还包括文档的预处理:
3.根据权利要求2所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,对所述整合后的术语列表,取原文部分在所述原文列表S中匹配,得到每个原文Si对应的术语对Ti,并逐个遍历{Si,Ri,Ti}进行术语干预,跳过所述术语对Ti为空的位置,在所述最高层级术语干预和所述中间层级术语干预设置有干预失败的检测,如果检测到干预失败,进入重试机制或者下一层级术语干预。
>4.根据权利...
【技术特征摘要】
1.一种基于大语言模型的多层级译文术语干预方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,还包括文档的预处理:
3.根据权利要求2所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,对所述整合后的术语列表,取原文部分在所述原文列表s中匹配,得到每个原文si对应的术语对ti,并逐个遍历{si,ri,ti}进行术语干预,跳过所述术语对ti为空的位置,在所述最高层级术语干预和所述中间层级术语干预设置有干预失败的检测,如果检测到干预失败,进入重试机制或者下一层级术语干预。
4.根据权利要求2所述的一种基于大语言模型的多层级译文术语干预方法,其特征在于,所述双语列表...
【专利技术属性】
技术研发人员:薛景元,姜征,李光华,
申请(专利权)人:甲骨易北京语言科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。