基于大语言模型适用于机器翻译的句子切分方法及装置制造方法及图纸

技术编号:42714793 阅读:30 留言:0更新日期:2024-09-13 12:04
本发明专利技术属于军事安全技术领域,公开了一种基于大语言模型适用于机器翻译的句子切分方法及装置,该方法包括:利用大语言模型的调优完成标点符号重构功能,实现标点符号重构模型的训练;利用标点符号重构模型优化机器翻译的输入文本;输出对应的翻译结果,完成本轮翻译。本发明专利技术通过使用大规模语言模型进行句子标点符号重构,实现句子切分的功能,解决机器翻译在实际使用过程中面临的不确定性输入时,无法进行有效切分的问题。从而提升机器翻译的可用性,提升机器翻译的翻译质量。带来的经济效益和社会效益主要体现在:提升了句子切分的准确性和有效性,提升了机器翻译的翻译质量,有助于减少后续人工审校的工作量,提升翻译效率。

【技术实现步骤摘要】

本专利技术属于军事安全,尤其涉及一种基于大语言模型适用于机器翻译的句子切分方法及装置


技术介绍

1、句子切分在机器翻译中一般是需要最先进行的处理工作,通常句子切分采用一种以标点符号作为切分标识的基于规则的切分方法,这种方法具有速度快,准确率高的优势。但是对于机器翻译经常会遇到不确定输入的场景时,这种基于规则的切分方法往往会产生许多问题。

2、例如在机器翻译的训练过程中,往往会把输入输出的句子限制在一个长度确定的范围内,例如1100个单词,在这种情况下,超过100个单词的句子就不会加入到训练中去,这样做,一方面是为了减小输入的长度,将模型维持在一个合适的规模。另一方面可以有效的控制解码的速度,将翻译时间控制在一个合理的范围。而在实际使用的过程中,尤其是面临互联网用户的输入时,会有许多的不规范输入,例如输入代码片段、url、文件路径、非目标语种字符、哈希码、超长的无符号文本等等,在这种情况下,传统的基于规则的句子切分方法就无法做到有效切分,这个时候,就需要采用一种更加有效的切分方法。


技术实现思路</b>

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型适用于机器翻译的句子切分方法,其特征在于,该方法包括:

2.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述S1中训练方法为选定开源的大语言模型进行LoRA微调。

3.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述微调的模板为:

4.如权利要求3所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述X词的数值为机器翻译模型训练过程中设置的训练数据最大长度。

5.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述S1具体包括:<...

【技术特征摘要】

1.一种基于大语言模型适用于机器翻译的句子切分方法,其特征在于,该方法包括:

2.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述s1中训练方法为选定开源的大语言模型进行lora微调。

3.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述微调的模板为:

4.如权利要求3所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述x词的数值为机器翻译模型训练过程中设置的训练数据最大长度。

5.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述s1具体包括:

6.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述s2具体包括:

7.如权利要求2所述基于大语言模型适用于机器翻译的句子切分方法,其特征在于,所述lora微调算法...

【专利技术属性】
技术研发人员:宗浩贝超苑聪虎刘欢陈文涛
申请(专利权)人:中译语通科技昆明有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1