文档离线翻译方法、装置、设备及存储介质制造方法及图纸

技术编号:43572829 阅读:13 留言:0更新日期:2024-12-06 17:41
本公开涉及文档离线翻译方法、装置、设备及存储介质。本公开通过获取目标文档的文档数据和目标文档翻译的目标语言;将文档数据和目标语言填充至预设聊天模板中,得到目标聊天模板;将目标聊天模板输入预先安装的目标离线翻译模型,基于目标离线翻译模型将文档数据翻译为目标语言,得到文档数据的翻译数据。本公开通过本地部署的目标离线翻译模型来实现文档翻译,目标离线翻译模型独立于外部网络环境,无需网络即可翻译文档,用户的文档数据不会直接传输到外部网络环境以至于承担文档信息泄露的风险,提高了文档翻译的安全性,将大语言模型本地化部署,可保证翻译服务的可控性,提高了文档翻译的用户体验。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及一种文档离线翻译方法、装置、设备及存储介质


技术介绍

1、在日常工作、学习以及生活过程中,人们总会需要阅读许多文档来获取信息、知识,但是受限于自身的语言能力,人们往往使用各种工具将文档翻译成母语后再进行浏览。尽管目前网络上提高了丰富的文档翻译工具和服务,但是在各种网络工具的使用过程中,往往会存在一些潜在风险,例如:

2、数据泄露:将带有敏感信息的文档上传到在线翻译平台时,存在文档内容被存储或不慎泄露给第三方的风险。免费的公共翻译工具和人工智能助手,可能缺乏严格的数据保护措施,导致敏感信息可能被存储在其服务器上,甚至在互联网上公开。即使服务商有严格的数据保护政策,如果涉及分包商或外部合作伙伴,数据在传输和处理过程中仍可能暴露给未经授权的第三方。

3、侵犯隐私:在线翻译服务可能收集并分析已翻译内容,可能无意中侵犯文档中涉及个人或企业的隐私。

4、服务不可控:第三方翻译服务可能未通知用户就进行服务更新和维护,用户对此可能缺乏控制权。

5、以上文档翻译存在的潜在风险,会降低用户的数据安全本文档来自技高网...

【技术保护点】

1.一种文档离线翻译方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标文档的文档数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述文档数据和所述目标语言填充至预设聊天模板中,得到目标聊天模板,包括:

4.根据权利要求3所述的方法,其特征在于,所述预设分割方式包括按字符分割、按句分割、按段分割和按页分割中的至少一种。

5.根据权利要求3所述的方法,其特征在于,所述文本块序列中的任意两个相邻文本块中具有预设数量的重叠字符数。

6.根据权利要求1所述的方法,其特征在于,所述将所述目标聊天模...

【技术特征摘要】

1.一种文档离线翻译方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标文档的文档数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述将所述文档数据和所述目标语言填充至预设聊天模板中,得到目标聊天模板,包括:

4.根据权利要求3所述的方法,其特征在于,所述预设分割方式包括按字符分割、按句分割、按段分割和按页分割中的至少一种。

5.根据权利要求3所述的方法,其特征在于,所述文本块序列中的任意两个相邻文本块中具有预设数量的重叠字符数。

6.根据权...

【专利技术属性】
技术研发人员:张晓军
申请(专利权)人:中电云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1