The embodiment of the invention provides a method and a device for mathematical formula recognition, the method comprises: receiving input image data, image data includes handwritten mathematical formula information; and determining one or more types of information, operation relations mathematical formula, one or more feature regions corresponding to and with the operation of each type of relationship; identifying one or more regions, have one or more elements combined with the formula; one or more operational relationship types, one or more elements are organized into formula and corresponding mathematical formula information of mathematical formula. The embodiment of the invention realizes the accurate recognition of handwritten mathematical formula, and in the recognition process and make full use of the structural properties of mathematical formulas, reduces the difficulty of character recognition, the recognition effect of process optimization and process, enhance the mathematical formula recognition accuracy and recognition speed, provide a more accurate convenient and mathematical formula input experience for users.
【技术实现步骤摘要】
一种数学公式识别方法和装置
本专利技术涉及数学公式识别领域,特别是涉及一种数学公式识别方法和一种数学公式识别装置。
技术介绍
在数学学科中,数学公式是学术文献的重要组成部分,目前主要利用MathType、LaTex两种工具对数学公式进行录入,但随着文档资料数字化需求的进一步增长,前面两种方法面对大量的复杂的数学公式时,编辑难度大,而且效率较低。联机手写数学公式识别可以为用户提供类似于纸上书写的数学公式录入方式,但由于数学公式复杂的结构极大地增加了计算机识别的难度,且手写输入设备的非精确性、书写笔体和速度、数学符号的二义性、结构的多变性等都给手写数学公式的识别和编辑进一步增加了难度。而且在现有的联机手写数学公式识别过程中,经常会出现对字符的错识问题,并且会将对字符的错识问题叠加到对整个数学公式的分析中,从而影响最终的数学公式识别结果,导致识别手写的数学公式不准确。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供克服上述问题或者至少部分地解决上述问题的一种数学公式识别方法和装置。为了解决上述问题,本专利技术实施例公开了一种数学公式识别的方法,所述方法包括:接收输入的图像数据,所述图像数据的内容包括手写的数学公式信息;确定与所述数学公式信息匹配的一个或多个运算关系类型,以及与每个运算关系类型对应的一个或多个特征区域;识别所述一个或多个特征区域,得到一个或多个公式元素;结合所述一个或多个运算关系类型,将所述一个或多个公式元素组织成与所述数学公式信息对应的数学公式。优选地,所述确定与所述数学公式信息匹配的一个或多个运算关系类型,以及每个运算关系类型对应的一个 ...
【技术保护点】
一种数学公式识别的方法,其特征在于,所述方法包括:接收输入的图像数据,所述图像数据的内容包括手写的数学公式信息;确定与所述数学公式信息匹配的一个或多个运算关系类型,以及与每个运算关系类型对应的一个或多个特征区域;识别所述一个或多个特征区域,得到一个或多个公式元素;结合所述一个或多个运算关系类型,将所述一个或多个公式元素组织成与所述数学公式信息对应的数学公式。
【技术特征摘要】
1.一种数学公式识别的方法,其特征在于,所述方法包括:接收输入的图像数据,所述图像数据的内容包括手写的数学公式信息;确定与所述数学公式信息匹配的一个或多个运算关系类型,以及与每个运算关系类型对应的一个或多个特征区域;识别所述一个或多个特征区域,得到一个或多个公式元素;结合所述一个或多个运算关系类型,将所述一个或多个公式元素组织成与所述数学公式信息对应的数学公式。2.根据权利要求1所述的方法,其特征在于,所述确定与所述数学公式信息匹配的一个或多个运算关系类型,以及每个运算关系类型对应的一个或多个特征区域的步骤包括:将所述图像数据输入预先生成的卷积神经网络模型,经由所述卷积神经网络模型识别出所述图像数据中所包含的一个或多个运算关系类型,以及,根据所述一个或多个运算关系类型将所述图像数据划分后得到的一个或多个特征区域。3.根据权利要求2所述的方法,其特征在于,所述卷积神经网络模型采用如下方式识别出所述图像数据中所包含的一个或多个运算关系类型:分别采用预置的多种运算关系类型的权重系数作为卷积核,对所述图像数据进行卷积操作,得到所述图像数据在各个运算关系类型中的概率;基于所述图像数据在各个运算关系类型中的概率,确定所述图像数据中所包含的一个或多个运算关系类型。4.根据权利要求1或2或3所述的方法,其特征在于,所述运算关系类型具有对应的结构关系,所述特征区域包括单一区域和/或混合区域,所述识别所述一个或多个特征区域,得到一个或多个公式元素的步骤包括:基于所述每个运算关系类型对应的结构关系,将所述单一区域作为一个基本单元,以及,对所述混合区域进行拆分,得到一个或多个基本单元;采用预设的光学字符识别算法识别所述一个或多个基本单元,得到一个或多个公式元素。5.根据权利要求4所述的方法,其特征在于,所述结合所述一个或多个运算关系类型,将所述一个或多个公式元素组织成与所述数学公式信息对应的数学公式的步骤包括:基于所述每个运算关系类型...
【专利技术属性】
技术研发人员:曹骥,王富田,李健,张连毅,武卫东,
申请(专利权)人:北京捷通华声科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。