【技术实现步骤摘要】
一种公式解析方法
本专利技术涉及文本处理
,尤其涉及一种公式解析方法。
技术介绍
随着互联网的不断普及和互联网技术的迅速发展,信息、在线化、智能化等信息处理手段正在向传统逐渐取代纸质文件。很多文件构建时,需要对大量包含公式的数据进行语义解析,如何准确地对包含数学公式的数据进行语义解析具重大意义。
技术实现思路
基于
技术介绍
存在的技术问题,本专利技术提出了一种公式解析方法。本专利技术提出的一种公式解析方法,首先根据字符间隙对公式进行切割,获取一个或多个字符单元;然后逐一识别各字符单元,并提取无法识别的字符单元作为分离对象;根据字符长度对各分离对象进行切割,获得切割字符,并对切割字符进行识别。优选的,逐一识别各字符单元的方式为,将每一个字符单元与预设的字符库中存储的字符逐一进行对比,获取与字符单元相符合的字符作为识别结果。优选的,对切割字符进行识别的方法为:将每一个切割字符与预设的字符库中存储的字符逐一进行对比,获取与切割字符相符合的字符。优选的,根据字符长度对各分离对象 ...
【技术保护点】
1.一种公式解析方法,其特征在于,首先根据字符间隙对公式进行切割,获取一个或多个字符单元;然后逐一识别各字符单元,并提取无法识别的字符单元作为分离对象;根据字符长度对各分离对象进行切割,获得切割字符,并对切割字符进行识别。/n
【技术特征摘要】
1.一种公式解析方法,其特征在于,首先根据字符间隙对公式进行切割,获取一个或多个字符单元;然后逐一识别各字符单元,并提取无法识别的字符单元作为分离对象;根据字符长度对各分离对象进行切割,获得切割字符,并对切割字符进行识别。
2.如权利要求1所述的公式解析方法,其特征在于,逐一识别各字符单元的方式为,将每一个字符单元与预设的字符库中存储的字符逐一进行对比,获取与字符单元相符合的字符作为识别结果。
3.如权利要求2所述的公式解析方法,其特征在于,对切割字符进行识别的方法为:将每一个切割字符与预设的字符库中存储的字符逐一进行对比,获取与切割字符相符合的字符。
4.如权利要求1所述的公式解析方法,其特征在于,根据字符长度对各分离对象进行切割的方法为:根据识别结果,获取标准字符长度,并根据标准字符长度对分离对象进行切割。
5.如权利要求4所述的公式解析方法,其特征在于,标准字符长度为成功识别的各字符单元的平均长度。
6.如权利要求4所述的公式解析方法,其特征在于,根据标准字符长度对分离对象进行切割的方法为:从分离对象的左侧起,逐一切割出长度等于标准字符长度的切割字符;对于剩余的不足一个标准字符长度的部分,获取其长度值,当其长度值与标准字符长度的比值大于或等于预设阈值,则将该剩余部分作为一个切割字符;反之,则放弃该剩余部分。
7.如权利要求6所述的公式解析方法,其特征在于,预设阈值大于或等于0.8。
8.如权利要求1至6任一项所述的公式解析方法,其特征在于,对于无法识别的切割字符,则根据其在字符单元中的排序,获取位置连续的不能识别的切割字符作为一个组合对象,然后对每一个组合对象,首先以最左侧的切割字符作为起始字符,然后将起始字符与右侧相邻的切割字符组合,并对组合字符进行识别:如果组合字符识别成功,则将与组合字符相邻的切割字符更新为起始字符...
【专利技术属性】
技术研发人员:董霞,李颖,齐苗苗,
申请(专利权)人:合肥长远知识产权管理有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。