一种公式解析方法技术

技术编号:24331617 阅读:46 留言:0更新日期:2020-05-29 19:51
本发明专利技术提出的一种公式解析方法,首先根据字符间隙对公式进行切割,获取一个或多个字符单元;然后逐一识别各字符单元,并提取无法识别的字符单元作为分离对象;根据字符长度对各分离对象进行切割,获得切割字符,并对切割字符进行识别。本发明专利技术提出的一种公式解析方法,通过对字符单元和切割字符的拆分,实现了将公式中每一个字符的单独确认。本发明专利技术是通过将公式拆分为字符,然后通过识别字符还原公式。如此,以字符识别代替公式识别,大大降低了识别难度,同时还提高了识别精度。

A method of formula analysis

【技术实现步骤摘要】
一种公式解析方法
本专利技术涉及文本处理
,尤其涉及一种公式解析方法。
技术介绍
随着互联网的不断普及和互联网技术的迅速发展,信息、在线化、智能化等信息处理手段正在向传统逐渐取代纸质文件。很多文件构建时,需要对大量包含公式的数据进行语义解析,如何准确地对包含数学公式的数据进行语义解析具重大意义。
技术实现思路
基于
技术介绍
存在的技术问题,本专利技术提出了一种公式解析方法。本专利技术提出的一种公式解析方法,首先根据字符间隙对公式进行切割,获取一个或多个字符单元;然后逐一识别各字符单元,并提取无法识别的字符单元作为分离对象;根据字符长度对各分离对象进行切割,获得切割字符,并对切割字符进行识别。优选的,逐一识别各字符单元的方式为,将每一个字符单元与预设的字符库中存储的字符逐一进行对比,获取与字符单元相符合的字符作为识别结果。优选的,对切割字符进行识别的方法为:将每一个切割字符与预设的字符库中存储的字符逐一进行对比,获取与切割字符相符合的字符。优选的,根据字符长度对各分离对象进行切割的方法为:根本文档来自技高网...

【技术保护点】
1.一种公式解析方法,其特征在于,首先根据字符间隙对公式进行切割,获取一个或多个字符单元;然后逐一识别各字符单元,并提取无法识别的字符单元作为分离对象;根据字符长度对各分离对象进行切割,获得切割字符,并对切割字符进行识别。/n

【技术特征摘要】
1.一种公式解析方法,其特征在于,首先根据字符间隙对公式进行切割,获取一个或多个字符单元;然后逐一识别各字符单元,并提取无法识别的字符单元作为分离对象;根据字符长度对各分离对象进行切割,获得切割字符,并对切割字符进行识别。


2.如权利要求1所述的公式解析方法,其特征在于,逐一识别各字符单元的方式为,将每一个字符单元与预设的字符库中存储的字符逐一进行对比,获取与字符单元相符合的字符作为识别结果。


3.如权利要求2所述的公式解析方法,其特征在于,对切割字符进行识别的方法为:将每一个切割字符与预设的字符库中存储的字符逐一进行对比,获取与切割字符相符合的字符。


4.如权利要求1所述的公式解析方法,其特征在于,根据字符长度对各分离对象进行切割的方法为:根据识别结果,获取标准字符长度,并根据标准字符长度对分离对象进行切割。


5.如权利要求4所述的公式解析方法,其特征在于,标准字符长度为成功识别的各字符单元的平均长度。


6.如权利要求4所述的公式解析方法,其特征在于,根据标准字符长度对分离对象进行切割的方法为:从分离对象的左侧起,逐一切割出长度等于标准字符长度的切割字符;对于剩余的不足一个标准字符长度的部分,获取其长度值,当其长度值与标准字符长度的比值大于或等于预设阈值,则将该剩余部分作为一个切割字符;反之,则放弃该剩余部分。


7.如权利要求6所述的公式解析方法,其特征在于,预设阈值大于或等于0.8。


8.如权利要求1至6任一项所述的公式解析方法,其特征在于,对于无法识别的切割字符,则根据其在字符单元中的排序,获取位置连续的不能识别的切割字符作为一个组合对象,然后对每一个组合对象,首先以最左侧的切割字符作为起始字符,然后将起始字符与右侧相邻的切割字符组合,并对组合字符进行识别:如果组合字符识别成功,则将与组合字符相邻的切割字符更新为起始字符...

【专利技术属性】
技术研发人员:董霞李颖齐苗苗
申请(专利权)人:合肥长远知识产权管理有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1