自然场景图像中手写体数学公式结构分析与识别方法技术

技术编号：12573832 阅读：171 留言：0更新日期：2015-12-23 14:34

一种自然场景图像中手写体数学公式结构分析与识别方法，包括：S1,将自然场景图像的灰度矩阵转换为局部对比度矩阵，使用otsu法对得到的局部对比度矩阵进行二值划分，得到二值矩阵；S2,对步骤S1中二值矩阵进行连通域分析，剔除非字符连通域，得到字符连通域；S3,采用相关系数法对S2中的字符连通域进行公式特殊结构元素检测，并对所有检测到的特殊结构元素进行单独标注；S4,采用水平投影法对S1中的二值矩阵进行行划分；S5：采用卷积神经网络对每个字符连通域进行识别；S6,定义输出顺序，将识别结果按照对应的顺序，以latex排版格式进行输出。该方法有效地解决OCR识别中初等数学公式的表示问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理与模式识别技术，特别是涉及自然场景图像中手写体数学公式结构分析与识别的方法。
技术介绍
OCR (Optical Character Recognition，光学字符识别）技术有着广泛的应用，针对中文和英文的OCR识别技术都比较成熟，但目前对于数学公式这种有复杂的结构的情况，目前的OCR技术没有很好的支持，本专利技术着重解决这一有很强应用需求的问题。
技术实现思路
本专利技术提供的，可以有效地解决OCR识别中初等数学公式的表示问题。本专利技术的，包括：步骤Sl :将自然场景图像的灰度矩阵转换为局部对比度矩阵，使用otsu(大津阈值）法对得到的局部对比度矩阵进行二值划分，得到二值矩阵；步骤S2 :对步骤Sl中二值矩阵进行连通域分析，剔除非字符连通域，得到字符连通域；步骤S3 :采用相关系数法对步骤S2中的字符连通域进行公式特殊结构元素检测，并对所有检测到的特殊结构元素进行单独标注；步骤S4 :采用水平投影法对步骤Sl中的二值矩阵进行行划分；步骤S5 :采用卷积神经网络对每个字符连通域进行识别；步骤S6 :定义输出顺序，将识别结果按照对应的顺序，以latex (基于T E X的排版系统）排版格式进行输出。优选的，所述局部对比度矩阵中坐标为（i，j)的点的局部对比度Con(i，j)计算公式为：其中， Inax(i，j)和I_(i，j)分别为图像的灰度矩阵中以坐标为（i，j)的点为中心的邻域的最大灰度值和最小灰度值，此处我们设置邻域的半径为5 ;，Std表示灰度矩阵的标准差，γ = 1。ε...

【技术保护点】
一种自然场景图像中手写体数学公式结构分析与识别方法，其特征在于，所述方法包括：步骤S1：将自然场景图像的灰度矩阵转换为局部对比度矩阵，使用otsu法对得到的局部对比度矩阵进行二值划分，得到二值矩阵；步骤S2：对步骤S1中二值矩阵进行连通域分析，剔除非字符连通域，得到字符连通域；步骤S3：采用相关系数法对步骤S2中的字符连通域进行公式特殊结构元素检测，并对所有检测到的特殊结构元素进行单独标注；步骤S4：采用水平投影法对步骤S1中的二值矩阵进行行划分；步骤S5：采用卷积神经网络对每个字符连通域进行识别；步骤S6：定义输出顺序，将识别结果按照对应的顺序，以latex排版格式进行输出。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈李江，刘宁，刘辉，
申请(专利权)人：北京云江科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人