文档处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40173121 阅读:30 留言:0更新日期:2024-01-26 23:42
本申请涉及数据处理技术领域,尤其涉及一种文档处理方法、装置、电子设备及存储介质,所述方法包括:获取待处理文档;所述待处理文档包括至少一个语句块;基于每个语句块对应的目标语言格式,确定与所述每个语句块对应的目标识别参照信息;基于所述目标识别参照信息对所述每个语句块进行数字识别,得到所述每个语句块对应的数字识别结果;在所述数字识别结果表征所述每个语句块中存在目标识别数字信息的情况下,生成与所述目标识别数字信息对应的替换执行信息;基于所述替换执行信息对所述待处理文档进行信息替换处理,得到已处理文档。本申请能够扩大适用的文档范围,提高数字识别效率。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种文档处理方法、装置、电子设备及存储介质


技术介绍

1、数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护,这样就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。

2、现有技术中在对文档进行脱敏处理时,一般是基于待处理文档的模板进行脱敏处理,该方法仅适用于模板结构明确的待脱敏电子文档,适用范围较小。


技术实现思路

1、本申请所要解决的技术问题在于,提供一种文档处理方法、装置、电子设备及存储介质,能够扩大适用的文档范围,并且能够对文档中处于同一语句块的一个或者多个数字串进行一次性识别,提高数字识别效率;进一步根据每个语句块的语言格式确定相应的识别参照信息,适用于文档中包含多语言格式的应用场景,提高了场景适用性。

2、为了解决上述技术问题,一方面,本申请提供了一种文档处理方法,包括:

3、获取待处理文档;所述待处理文档包括至少一个语句块;同一语句块中的文字具有相同的语言格式,相邻的两个语句本文档来自技高网...

【技术保护点】

1.一种文档处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述目标识别参照信息包括目标数字信息以及目标单位信息;

3.根据权利要求1所述的方法,其特征在于,所述目标识别数字信息包括识别数字和识别单位;

4.根据权利要求3所述的方法,其特征在于,所述基于所述当前文字对应的当前单位值以及所述缓存数字区的数值进行关联处理,得到目标数值,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述当前文字对应的当前单位值以及所述缓存数字区的数值进行关联处理,得到目标数值,包括:

6.根据权利要求5所述的方法,...

【技术特征摘要】

1.一种文档处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述目标识别参照信息包括目标数字信息以及目标单位信息;

3.根据权利要求1所述的方法,其特征在于,所述目标识别数字信息包括识别数字和识别单位;

4.根据权利要求3所述的方法,其特征在于,所述基于所述当前文字对应的当前单位值以及所述缓存数字区的数值进行关联处理,得到目标数值,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述当前文字对应的当前单位值以及所述缓存数字区的数值进行关联处理,得到目标数值,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述当前文字对应的当前单位值以及所述缓存数字区的数值进行关联处理,得到目标数值,包括:

7.根据权利要求4-6任一项所述的方法,其特征在于,所述基于所述当前数字区的数据以及所述整数结果区的数据生成所述目标数值,包括:

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述基于每个语句...

【专利技术属性】
技术研发人员:赵长恩
申请(专利权)人:腾讯科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1