文本处理方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:35897098 阅读:17 留言:0更新日期:2022-12-10 10:31
本公开提供了一种文本处理方法、装置、设备、介质及程序产品,涉及计算机技术领域。所述业务处理方法包括:获取待翻译的目标文本;根据目标文本确定包含目标字位的目标词语,以及目标词语的译文词语;若确定目标词语包括多个字位,则根据目标字位在目标词语中的位置区间,以及目标字位的富文本格式信息,显示目标词语的译文词语。本公开提高了译文文本中富文本格式的保留位置的精准度。本格式的保留位置的精准度。本格式的保留位置的精准度。

【技术实现步骤摘要】
文本处理方法、装置、设备、介质及程序产品


[0001]本公开涉及计算机
,尤其涉及一种文本处理方法、文本处理装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]在文档编辑过程中,可以将文档内容处理为富文本格式,以提示文档阅读用户关注格式特殊处理后的文档内容,使用户高效的获取文档中的重点信息。
[0003]随着文档编辑产品功能的日益丰富,可以对文档中的内容进行翻译,相关技术中,对于需要翻译的目标文本,若目标文本为富文本格式,可以忽略目标文本的富文本格式,直接获得译文文本;或者,可以在翻译目标文本内容的过程中,在译文文本中也保留目标文本的富文本格式。
[0004]但是,相关技术中提供的文档处理技术,在目标文本被翻译后,得到的保留有富文本格式的译文文本,通常与富文本格式的目标文本不对应,导致译文文本不能精准的保留目标文本的富文本格式,影响用户的阅读体验。

技术实现思路

[0005]本公开提供一种文本处理方法、装置、设备、介质及程序产品,以至少解决相关技术中译文文本中富文本格式的保留位置不精准的问题。本公开的技术方案如下:
[0006]根据本公开实施例的第一方面,提供一种文本处理方法,其特征在于,包括:
[0007]获取待翻译的目标文本,所述目标文本中包含目标字位,所述目标字位的文本格式为富文本格式;
[0008]根据所述目标文本确定包含所述目标字位的目标词语,以及所述目标词语的译文词语;
[0009]若确定所述目标词语包括多个字位,则根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语。
[0010]可选的,所述根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语,包括:
[0011]确定所述目标字位在所述目标词语中的位置区间;
[0012]将所述目标词语的译文词语中处于所述位置区间的译文字位,确定为所述目标字位的目标译文字位;
[0013]在显示所述目标词语的译文词语时,按照所述富文本格式信息显示所述目标译文字位。
[0014]可选的,所述确定所述目标字位在所述目标词语中的位置区间,包括:
[0015]确定所述目标词语中的第一字位总数量,以及所述目标字位在所述目标词语中的目标位置序号;
[0016]根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信
息;
[0017]组合所述起始端点信息和所述结束端点信息,得到所述目标字位在所述目标词语中的位置区间。
[0018]可选的,所述目标字位的数量包括一个,所述根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息,包括:
[0019]确定所述目标位置序号和参考值的差值,并确定所述差值和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
[0020]确定所述目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
[0021]可选的,所述目标字位的数量包括相邻的多个,所述根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息,包括:
[0022]确定相邻的多个所述目标字位中,最小目标位置序号和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
[0023]确定相邻的多个所述目标字位中,最大目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
[0024]可选的,所述将所述目标词语的译文词语中处于所述位置区间的译文字位,确定为所述目标字位的目标译文字位,包括:
[0025]确定所述目标词语的译文词语的第二字位总数量;
[0026]确定所述位置区间的起始端点信息和所述第二字位总数量的乘积,得到目标译文字位的初始字位序号;
[0027]确定所述位置区间的结束端点信息和所述第二字位总数量的乘积,得到目标译文字位的结束字位序号;
[0028]将所述目标词语的译文词语中,与所述初始字位序号、所述结束字位序号,以及所述初始字位序号和所述结束字位序号之间的字位序号对应的译文字位,确定为所述目标词语的目标译文字位。
[0029]可选的,所述方法还包括:
[0030]若所述目标词语包括一个字位,则根据所述目标字位的富文本格式信息,显示所述目标词语的译文词语。
[0031]根据本公开实施例的第二方面,提供一种文本处理装置,包括:
[0032]获取模块,被配置为获取待翻译的目标文本,所述目标文本中包含目标字位,所述目标字位的文本格式为富文本格式;
[0033]第一确定模块,被配置为根据所述目标文本确定包含所述目标字位的目标词语,以及所述目标词语的译文词语;
[0034]第一显示控制模块,被配置为若确定所述目标词语包括多个字位,则根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语。
[0035]可选的,第一显示控制模块,被配置为:
[0036]确定所述目标字位在所述目标词语中的位置区间;
[0037]将所述目标词语的译文词语中处于所述位置区间的译文字位,确定为所述目标字
位的目标译文字位;
[0038]在显示所述目标词语的译文词语时,按照所述富文本格式信息显示所述目标译文字位。
[0039]可选的,第一显示控制模块,被配置为:
[0040]确定所述目标词语中的第一字位总数量,以及所述目标字位在所述目标词语中的目标位置序号;
[0041]根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息;
[0042]组合所述起始端点信息和所述结束端点信息,得到所述目标字位在所述目标词语中的位置区间。
[0043]可选的,第一显示控制模块,被配置为:
[0044]确定所述目标位置序号和参考值的差值,并确定所述差值和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
[0045]确定所述目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
[0046]可选的,第一显示控制模块,被配置为:
[0047]确定相邻的多个所述目标字位中,最小目标位置序号和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;
[0048]确定相邻的多个所述目标字位中,最大目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。
[0049]可选的,第一显示控制模块,被配置为:
[0050]确定所述目标词语的译文词语的第二字位总数量;
[0051]确定所述位置区间的起始端点信息和所述第二字位总数量的乘积,得到目标译文字位的初始字位序号;
[0052]确定所述位置区间的结束端点信息和所述第二字位总数量的乘积,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取待翻译的目标文本,所述目标文本中包含目标字位,所述目标字位的文本格式为富文本格式;根据所述目标文本确定包含所述目标字位的目标词语,以及所述目标词语的译文词语;若确定所述目标词语包括多个字位,则根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语。2.根据权利要求1所述的文本处理方法,其特征在于,所述根据所述目标字位在所述目标词语中的位置区间,以及所述目标字位的富文本格式信息,显示所述目标词语的译文词语,包括:确定所述目标字位在所述目标词语中的位置区间;将所述目标词语的译文词语中处于所述位置区间的译文字位,确定为所述目标字位的目标译文字位;在显示所述目标词语的译文词语时,按照所述富文本格式信息显示所述目标译文字位。3.根据权利要求2所述的文本处理方法,其特征在于,所述确定所述目标字位在所述目标词语中的位置区间,包括:确定所述目标词语中的第一字位总数量,以及所述目标字位在所述目标词语中的目标位置序号;根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息;组合所述起始端点信息和所述结束端点信息,得到所述目标字位在所述目标词语中的位置区间。4.根据权利要求3所述的文本处理方法,其特征在于,所述目标字位的数量包括一个,所述根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息,包括:确定所述目标位置序号和参考值的差值,并确定所述差值和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;确定所述目标位置序号和所述第一字位总数量的比值,得到所述位置区间的结束端点信息。5.根据权利要求3所述的文本处理方法,其特征在于,所述目标字位的数量包括相邻的多个,所述根据所述目标位置序号和所述第一字位总数量,确定起始端点信息和结束端点信息,包括:确定相邻的多个所述目标字位中,最小目标位置序号和所述第一字位总数量的比值,得到所述位置区间的起始端点信息;确定相邻...

【专利技术属性】
技术研发人员:张文韬
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1