基于大语言模型适用于机器翻译的句子切分方法及装置制造方法及图纸

技术编号：42714793 阅读：30 留言：0更新日期：2024-09-13 12:04

本发明专利技术属于军事安全技术领域，公开了一种基于大语言模型适用于机器翻译的句子切分方法及装置，该方法包括：利用大语言模型的调优完成标点符号重构功能，实现标点符号重构模型的训练；利用标点符号重构模型优化机器翻译的输入文本；输出对应的翻译结果，完成本轮翻译。本发明专利技术通过使用大规模语言模型进行句子标点符号重构，实现句子切分的功能，解决机器翻译在实际使用过程中面临的不确定性输入时，无法进行有效切分的问题。从而提升机器翻译的可用性，提升机器翻译的翻译质量。带来的经济效益和社会效益主要体现在：提升了句子切分的准确性和有效性，提升了机器翻译的翻译质量，有助于减少后续人工审校的工作量，提升翻译效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于军事安全，尤其涉及一种基于大语言模型适用于机器翻译的句子切分方法及装置。

技术介绍

1、句子切分在机器翻译中一般是需要最先进行的处理工作，通常句子切分采用一种以标点符号作为切分标识的基于规则的切分方法，这种方法具有速度快，准确率高的优势。但是对于机器翻译经常会遇到不确定输入的场景时，这种基于规则的切分方法往往会产生许多问题。

2、例如在机器翻译的训练过程中，往往会把输入输出的句子限制在一个长度确定的范围内，例如1100个单词，在这种情况下，超过100个单词的句子就不会加入到训练中去，这样做，一方面是为了减小输入的长度，将模型维持在一个合适的规模。另一方面可以有效的控制解码的速度，将翻译时间控制在一个合理的范围。而在实际使用的过程中，尤其是面临互联网用户的输入时，会有许多的不规范输入，例如输入代码片段、url、文件路径、非目标语种字符、哈希码、超长的无符号文本等等，在这种情况下，传统的基于规则的句子切分方法就无法做到有效切分，这个时候，就需要采用一种更加有效的切分方法。

技术实现思路</b>

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型适用于机器翻译的句子切分方法，其特征在于，该方法包括：
2.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述S1中训练方法为选定开源的大语言模型进行LoRA微调。
3.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述微调的模板为：
4.如权利要求3所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述X词的数值为机器翻译模型训练过程中设置的训练数据最大长度。
5.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述S1具体包括：<...

【技术特征摘要】

1.一种基于大语言模型适用于机器翻译的句子切分方法，其特征在于，该方法包括：
2.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述s1中训练方法为选定开源的大语言模型进行lora微调。
3.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述微调的模板为：
4.如权利要求3所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述x词的数值为机器翻译模型训练过程中设置的训练数据最大长度。
5.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述s1具体包括：
6.如权利要求1所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述s2具体包括：
7.如权利要求2所述基于大语言模型适用于机器翻译的句子切分方法，其特征在于，所述lora微调算法...

【专利技术属性】
技术研发人员：宗浩，贝超，苑聪虎，刘欢，陈文涛，
申请(专利权)人：中译语通科技昆明有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：定位块、配电箱、储能装置和用电设备制造方法及图纸
下一篇：一种边角料压实打包机制造技术

相关技术

一种基于小样本机器学习和知识驱动的低...

基于混合专家网络的多语言神经机器翻译...

一种通过利用知识融合提高小语种机器翻...

一种在资源受限环境下进行多语言神经机...

一种基于MoE体系架构的超大规模多语...

面向机器翻译的数据选择和增量的训练方...

基于大语言模型的术语翻译方法及装置制...

一种短句语种识别的方法及系统技术方案

一种适用于机器翻译的句子改写切分方法...

一种全生命周期碳足迹动态测算方法技术

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

一种应用于轻薄料废钢压块质检的智能判...

一种基于VR设备的智慧旅游系统技术方...

基于神经网络的水下声呐图像目标检测方...

基于月消纳比率的分布式光伏EMC电价...

程序攻击风险的检测方法和装置、存储介...

一种智能灯具与设计图纸的数字化关联和...

一种点云角点特征的快速提取和聚类方法...

一种基于双网协同训练的DNN后门消除...