【技术实现步骤摘要】
一种公式识别方法、装置、设备及存储介质
本申请涉及信息识别
,尤其涉及一种公式识别方法、装置、设备及存储介质。
技术介绍
在一些应用中,需要从包含公式的图像中识别出公式。现有的公式识别方法多为基于OCR识别模型的公式识别方法,即,利用预先训练得到的OCR识别模型从包含公式的图像中识别出公式。现有的公式识别方法的识别效果取决于OCR识别模型的识别效果,而OCR识别模型的识别效果取决于训练数据。然而,由于包含简单公式的训练数据较多,而包含复杂公式的训练数据较少,因此,基于OCR识别模型的公式识别方法对于包含复杂公式的图像识别效果不佳。
技术实现思路
有鉴于此,本申请提供了一种公式识别方法、装置、设备及存储介质,用以解决现有技术中基于OCR识别模型的公式识别方法对于包含复杂公式的图像识别效果不佳的问题,其技术方案如下:一种公式识别方法,包括:获取包含待识别公式的目标图像;从所述目标图像中确定出所述待识别公式的结构信息,并利用字符识别模型从所述目标图像中识别出公式;根 ...
【技术保护点】
1.一种公式识别方法,其特征在于,包括:/n获取包含待识别公式的目标图像;/n从所述目标图像中确定出所述待识别公式的结构信息,并利用字符识别模型从所述目标图像中识别出公式;/n根据所述待识别公式的结构信息,修正利用所述字符识别模型识别出的公式,修正后的公式作为所述目标图像的公式识别结果。/n
【技术特征摘要】
1.一种公式识别方法,其特征在于,包括:
获取包含待识别公式的目标图像;
从所述目标图像中确定出所述待识别公式的结构信息,并利用字符识别模型从所述目标图像中识别出公式;
根据所述待识别公式的结构信息,修正利用所述字符识别模型识别出的公式,修正后的公式作为所述目标图像的公式识别结果。
2.根据权利要求1所述的公式识别方法,其特征在于,所述从所述目标图像中确定出所述待识别公式的结构信息,并利用字符识别模型从所述目标图像中识别出公式,包括:
从所述目标图像中检测出包含所述待识别公式的图像区域,作为目标图像区域;
从所述目标图像区域中确定出所述待识别公式的结构信息,并利用字符识别模型从所述目标图像区域中识别出公式。
3.根据权利要求2所述的公式识别方法,其特征在于,所述从所述目标图像区域中确定出所述待识别公式的结构信息,包括:
从所述目标图像区域中提取出所述待识别公式中各个公式字符的位置信息;
根据所述待识别公式中各个公式字符的位置信息,确定所述待识别公式的结构信息。
4.根据权利要求3所述的公式识别方法,其特征在于,所述利用字符识别模型从所述目标图像区域中识别出公式,包括:
利用所述待识别公式中各个公式字符的位置信息,从所述目标图像区域中提取出所述待识别公式的图像;
利用所述字符识别模型从所述待识别公式的图像中识别出公式。
5.根据权利要求3所述的公式识别方法,其特征在于,所述根据所述待识别公式中各个公式字符的位置信息,确定所述待识别公式的结构信息,包括:
根据所述待识别公式中各个公式字符的位置信息构建字符关系得分表,其中,所述字符关系得分表中包括代表所述待识别公式中各个公式字符的字符标识,以及所述待识别公式中的每个公式字符分别与其它各个公式字符的关系得分,所述字符关系得分表中的各个字符标识根据所述待识别公式中各个公式字符的位置信息排序;
根据所述字符关系得分表,确定所述待识别公式的结构信息。
6.根据权利要求5所述的公式识别方法,其特征在于,所述根据所述待识别公式中各个公式字符的位置信息构建字符关系得分表,包括:
根据所述待识别公式中各个公式字符的位置信息,确定所述待识别公式中每个公式字符与其周边公式字符的关系得分,其中,一个公式字符的周边公式字符为位于该公式字符的正上方、正下方、右上方、右下方、右中间位置的公式字符,一个公式字符与一个其周边公式字符的得分根据该周边公式字符与该公式字符的相对位置确定;
根据所述待识别公式中每个公式字符与其周边公式字符的关系得分构建字符关系得分表。
7.根据权利要求5所述的公式识别方法,其特征在于,所述根据所述字符关系得分表,确定所述待识别公式的结构信息,包括:
将所述字符关系得分表中的第一个字符标识作为当前字符标识;
根据所述字符关系得分表,确定与当前字符标识...
【专利技术属性】
技术研发人员:潘鹏举,何春江,李红雄,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。