【技术实现步骤摘要】
文本修正方法以及装置
[0001]本说明书实施例涉及文本编辑
,特别涉及一种文本修正方法以及装置。
技术介绍
[0002]随着互联网技术的发展,多种类型的文本在相关项目和服务中扮演越来越重要的角色。
[0003]由于文本数量的增加,和各种文本获取工具的开发,已经摒弃了过去用专门的文本格式文件进行传输,需要在多种文本格式间进行文本转转换,才能更大范围地使用文本信息。
[0004]但是,由于获取的文本来源众多,相关的文本编译规则差异很大,因而直接对不同格式的文本进行转换,会出现文本字符无法被识别的问题。因此,亟需一种文本修正方法,对难以识别的文本字符进行修正,来满足不同格式在完成转换后,依然可以在后续得到充分利用。
技术实现思路
[0005]有鉴于此,本说明书实施例提供了一种文本修正方法。本说明书一个或者多个实施例同时涉及一种文本修正装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0006]根据本说明书实施例的第一方面,提供了一种文本
【技术保护点】
【技术特征摘要】
1.一种文本修正方法,包括:获取原始文本和配置文件,其中,所述配置文件用于记录异常字符与常规字符的对应关系;对所述原始文本中的各字符进行识别,若识别出目标异常字符,则查询所述配置文件,确定所述目标异常字符对应的目标常规字符;利用所述目标常规字符替换所述原始文本中的所述目标异常字符,得到修正文本。2.根据权利要求1所述的方法,所述配置文件中记录的是异常字符的字符编码与常规字符的对应关系;所述查询所述配置文件,确定所述目标异常字符对应的目标常规字符,包括:对所述目标异常字符进行编码,得到所述目标异常字符的字符编码;基于所述目标异常字符的字符编码,查询所述配置文件,确定所述目标异常字符的字符编码对应的目标常规字符。3.根据权利要求2所述的方法,在所述对所述目标异常字符进行编码,得到所述目标异常字符的字符编码之后,还包括:基于所述目标异常字符的字符编码,采用预设的搜索工具,从所述原始文本中搜索出预设范围内的所述目标异常字符;所述利用所述目标常规字符替换所述原始文本中的所述目标异常字符,得到修正文本,包括:利用所述目标常规字符替换所述原始文本中所述预设范围内的所述目标异常字符,得到修正文本。4.根据权利要求1
‑
3任一项所述的方法,在所述查询所述配置文件之后,还包括:若查询不到所述目标异常字符对应的目标常规字符,则向...
【专利技术属性】
技术研发人员:吕志强,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。