一种应用于文本转换的公式解析方法技术

技术编号：24251968 阅读：64 留言：0更新日期：2020-05-22 23:47

本发明专利技术提出的一种应用于文本转换的公式解析方法，首先将原始文本转换为目标文本；对目标文本中的公式进行识别，并判断识别是否成功；对于不能辨别的公式，根据原始文本的解析结果重新应用目标格式进行合成，并将合成后的公式覆盖目标文本中对应的公式；对新插入的公式重新进行识别；对依然不能识别的公式，在目标文本中插入等长的空格，然后从原始文本中对公式保存为图片，将图片插入目标文本中对应的空格。本发明专利技术，保证了公式的正确显示，从而保证了目标文本对原始文本的信息的完整复制和精确。

A formula analysis method applied to text conversion

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于文本转换的公式解析方法
本专利技术涉及文本解析
，尤其涉及一种应用于文本转换的公式解析方法。
技术介绍
公式作为一种数学表达形式，在很多电子文件中均会出现。电子文件作为信息化数据的重要体现，其动态表达形式给使用者带来了很大的便利。但是，公式作为一种与文字不同的表达形式，其对应用程序的使用要求更高。故而，很多文件在转换时，容易丢失公式信息。
技术实现思路
基于
技术介绍
存在的技术问题，本专利技术提出了一种应用于文本转换的公式解析方法。本专利技术提出的一种应用于文本转换的公式解析方法，首先将原始文本转换为目标文本；对目标文本中的公式进行识别，并判断识别是否成功；对于不能辨别的公式，根据原始文本的解析结果重新应用目标格式进行合成，并将合成后的公式覆盖目标文本中对应的公式；对新插入的公式重新进行识别；对依然不能识别的公式，在目标文本中插入等长的空格，然后从原始文本中对公式保存为图片，将图片插入目标文本中对应的空格；公式辨别方法为；提取目标文本中的公式作为识别对象，根据字符间隙将识别对...

【技术保护点】
1.一种应用于文本转换的公式解析方法，其特征在于，首先将原始文本转换为目标文本；对目标文本中的公式进行识别，并判断识别是否成功；对于不能辨别的公式，根据原始文本的解析结果重新应用目标格式进行合成，并将合成后的公式覆盖目标文本中对应的公式；对新插入的公式重新进行识别；对依然不能识别的公式，在目标文本中插入等长的空格，然后从原始文本中对公式保存为图片，将图片插入目标文本中对应的空格；/n公式辨别方法为；提取目标文本中的公式作为识别对象，根据字符间隙将识别对象分割为多个字符单元，并对每一个字符单元进行识别；对无法识别的字符单元根据单个字符长度进行切割，然后对切割字符进行识别。/n

【技术特征摘要】
1.一种应用于文本转换的公式解析方法，其特征在于，首先将原始文本转换为目标文本；对目标文本中的公式进行识别，并判断识别是否成功；对于不能辨别的公式，根据原始文本的解析结果重新应用目标格式进行合成，并将合成后的公式覆盖目标文本中对应的公式；对新插入的公式重新进行识别；对依然不能识别的公式，在目标文本中插入等长的空格，然后从原始文本中对公式保存为图片，将图片插入目标文本中对应的空格；
公式辨别方法为；提取目标文本中的公式作为识别对象，根据字符间隙将识别对象分割为多个字符单元，并对每一个字符单元进行识别；对无法识别的字符单元根据单个字符长度进行切割，然后对切割字符进行识别。

2.如权利要求1所述的应用于文本转换的公式解析方法，其特征在于，对每一个字符单元进行识别的方法为：将每一个字符单元与预设的字符库中存储的字符逐一进行对比，获取与字符单元相符合的字符。

3.如权利要求1所述的应用于文本转换的公式解析方法，其特征在于，对切割字符进行识别的方法为：将每一个切割字符与预设的字符库中存储的字符逐一进行对比，获取与切割字符相符合的字符。

4.如权利要求1至3任一项所述的应用于文本转换的公式解析方法，其特征在于，具体包括以下步骤：
S1、首先将原始文本转换为目标文本，设置标志位并进行初始化；
S2、提取目标文本中的公式作为识别对象，根据字符间隙将识别对象分割为多个字符单元，并对每一个字符单元进行识别；
S3、对无法识别的字符单元根据单个字符长度进行切割，然后对切割字符进行识别；
S4、获取无法识别的公式，并判断标志位是否为0；
S5、是，则根据原始文本的解析结果重新应用目标格式进行合成，并将合成后的公式覆盖目标文本中对应的公式；然后将标志位加1后返回步骤S2；
S6、如果标志位不为0，则在目标文本中插入用于填充公式的空格，然后从原始文本中对公式保存为图片，将图...

【专利技术属性】
技术研发人员：齐苗苗，董霞，李颖，
申请(专利权)人：合肥长远知识产权管理有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人