富文本文档的翻译方法及装置制造方法及图纸

技术编号:30435521 阅读:74 留言:0更新日期:2021-10-24 17:35
本申请公开了一种富文本文档的翻译方法及装置,所述翻译方法包括:获取待翻译的富文本文档;提取所述富文本文档中的第一语言的各个第一纯文本字符串;获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串;使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串。中的对应所述第一纯文本字符串。中的对应所述第一纯文本字符串。

【技术实现步骤摘要】
富文本文档的翻译方法及装置


[0001]本申请涉及网页翻译
,尤其涉及一种富文本文档的翻译方法及装置。

技术介绍

[0002]在常见的超文本标记语言(Hyper Text Mark

up Language,HTML)格式的富文本文档中,其内容一般包括文字、图片、视频、超级链接、表格、有序/无序列表以及复杂的样式等多种信息。而翻译HTML格式的富文本文档只需要对文档中的文字进行处理即可。
[0003]在相关技术中,大多数服务只能解决纯文本格式的翻译,少量提供富文本格式支持的服务需要额外的费用,并且在翻译完成后可能会导致文档的排版发生变化。

技术实现思路

[0004]本申请公开一种富文本文档的翻译方法及装置,解决了在对富文本文档翻译完成后可能会导致文档的排版发生变化的问题。
[0005]为了解决上述问题,本申请采用下述技术方案:
[0006]第一方面,本申请实施例公开一种富文本文档的翻译方法,包括:获取待翻译的富文本文档;提取所述富文本文档中的第一语言的各个第一纯文本字符串;获取各个本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种富文本文档的翻译方法,其特征在于,包括:获取待翻译的富文本文档;提取所述富文本文档中的第一语言的各个第一纯文本字符串;获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串;使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串。2.根据权利要求1所述的翻译方法,其特征在于,提取所述富文本文档中的第一语言的各个第一纯文本字符串,包括:将所述富文本文档解析为文档对象模型;提取所述文档对象模型中的第一语言的各个第一纯文本字符串。3.根据权利要求2所述的翻译方法,其特征在于,提取所述文档对象模型中的第一语言的各个第一纯文本字符串,包括:提取各个所述第一纯文本字符串,并将所述文档对象模型中的各个所述第一纯文本字符串分别替换为占位符。4.根据权利要求3所述的翻译方法,其特征在于,使用所述第二纯文本字符串替换所述富文本文档中的对应所述第一纯文本字符串,包括:使用所述第二纯文本字符串替换对应的所述占位符。5.根据权利要求1所述的翻译方法,其特征在于,在提取所述富文本文档中的第一语言的各个第一纯文本字符串之后,还包括:将提取的各个所述第一纯文本字符串中的文本组合为第一字符串文本。6.根据权利要求5所述的翻译方法,其特征在于,获取各个所述第一纯文本字符串对应的第二语言的第二纯文本字符串,包括:获取所述第一字符串文本对应的所述第二语言的第二字符串文本,将所述第二字符串文本进行拆分,得到各个所述第一纯文本字符串对应的所述第二纯文本字符串。7.一种富文本文档的翻译装置,其特征在于,包括:第一获取模块,用于获取待翻译的富文...

【专利技术属性】
技术研发人员:李华顺
申请(专利权)人:杭州隆埠科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1