【技术实现步骤摘要】
201610223574
【技术保护点】
一种基于化学公式特征进行图像中化学公式检测的方法,具体步骤为:本专利技术是对任意文本图像进行灰度变换、二值化、投影分割,对分割出的字符通过模板检测以及对分割出的字符进行水平投影和垂直投影,获取分割字符在水平和垂直方向上的投影特征,并与给定字符的水平与垂直投影特征进行对比检测的方法对图像中的化学公式进行检测,同时还通过对整幅图像进行检测判断图像是否为化学公式图像,其特征在于:所述的对分割出的字符通过模板检测以及对分割出的字符进行水平投影和垂直投影,获取分割字符在水平和垂直方向上的投影特征,并与给定字符的水平与垂直投影特征进行对比检测的方法对图像中的化学公式进行检测,同时还通过对整幅图像进行检测判断图像是否为化学公式图像的具体方法如下:步骤1,对图像进行灰度变换、二值化,对二值化的图像进行垂直投影分割与水平投影分割,直到图像不能再分割为止,获得分割字符的位置链表S1;步骤2,对S1中的字符进行化学公式中单/双键的检测:步骤2.1,对S1中的字符进行水平直线或垂直直线的检测,若检测的字符为水平直线或垂直直线,进行步骤2.2检测,若未检测到水平直线或垂直直线,则进行步骤3的检测;步骤2.2,若 ...
【技术特征摘要】
1.一种基于化学公式特征进行图像中化学公式检测的方法,具体步骤为:本发明是对任意文本图像进行灰度变换、二值化、投影分割,对分割出的字符通过模板检测以及对分割出的字符进行水平投影和垂直投影,获取分割字符在水平和垂直方向上的投影特征,并与给定字符的水平与垂直投影特征进行对比检测的方法对图像中的化学公式进行检测,同时还通过对整幅图像进行检测判断图像是否为化学公式图像,其特征在于:所述的对分割出的字符通过模板检测以及对分割出的字符进行水平投影和垂直投影,获取分割字符在水平和垂直方向上的投影特征,并与给定字符的水平与垂直投影特征进行对比检测的方法对图像中的化学公式进行检测,同时还通过对整幅图像进行检测判断图像是否为化学公式图像的具体方法如下:步骤1,对图像进行灰度变换、二值化,对二值化的图像进行垂直投影分割与水平投影分割,直到图像不能再分割为止,获得分割字符的位置链表S1;步骤2,对S1中的字符进行化学公式中单/双键的检测:步骤2.1,对S1中的字符进行水平直线或垂直直线的检测,若检测的字符为水平直线或垂直直线,进行步骤2.2检测,若未检测到水平直线或垂直直线,则进行步骤3的检测;步骤2.2,若检测到字符a为水平直线,进行步骤2.2.1检测;若检测到字符a为垂直直线,进行步骤2.2.2检测;步骤2.2.1,检测字符a水平直线上下两侧距离水平直线上下边界第一阈值的范围内是否含有其他字符存在;步骤2.2.2,检测字符a垂直直线的左右两侧在距离垂直直线左右边界第一阈值的范围内是否含有其他字符存在;若步骤2.2.1或者步骤2.2.2中字符a两侧均没有字符存在则进行步骤2.3水平单键或者垂直单键判断,若字符a两侧至少有一侧含有与字符a为同方向的直线,则进行步骤2.4水平双键或者垂直双键判断;否则接着对S1中的字符进行步骤2.1的检测;步骤2.3,对字符进行化学公式中水平单键或者垂直单键的判断:若字符a为水平直线,判断字符a宽度是否大于图像中一个字符的宽度,如果大于图像中一个字符的宽度,则判定为化学公式中的水平单键,停止对图像的检测,判定图像为化学公式图像,否则停止对字符a进行水平单键检测,接着对S1中的字符进行步骤2.1的检测;若字符a为垂直直线,检测距离垂直直线上侧边界与下侧边界第二阈值的范围内是否含有字符存在,若两侧均含有字符,则判定为化学公式中的垂直单键,停止对图像的检测,判定图像为化学公式图像,否则停止对字符a进行垂直单键检测,接着对S1中的字符进行步骤2.1的检测;步骤2.4,若含有字符b与字符a为同方向的直线,对字符a与字符b进行水平双键或者垂直双键判断:若字符a为水平直线,则进行步骤2.4.1水平双键检测;若字符a为垂直直线,则进行步骤2.2.2垂直双键检测;步骤2.4.1,判断字符a的宽度是否大于图像中一个字符的宽度,若小于图像中一个字符的宽度,则停止对字符a进行双键检测,接着对S1中的字符进行步骤2.1的检测;若大于图像中一个字符的宽度,判断字符b的左右边界值与字符a的左右边界值是否近似相等,若满足条件,则判定为化学公式中的水平双键,停止对图像的检测,判定图像为化学公式图像,否则停止对字符a进行双键检测,接着对S1中的字符进行步骤2.1的检测;步骤2.4.2,判断字符b的上下边界值与字符a的上下边界值是否近似相等,若字符a与字符b的上下边界值不近似相等,则停止对字符a进行双键检测,接着对S1中的字符进行步骤2.1的检测;若两字符的上下边界值近似相等,则检测距离字符a上侧与下侧第二阈值的范围内是否含有字符存在,若两侧均含有字符,则判定为化学公式中的垂直双键,停止对图像的检测,判定图像为化学公式图像,否则停止对字符a进行双键检测,接着对S1中的字符进行步骤2.1的检测;步骤3,对S1中的字符进行模板匹配检测:步骤3.1,对S1中的字符选取一定数量宽度高度均小于第三阈值的字符进行归一化处理;步骤3.2,通过欧式距离计算待检测字符与二值化的模板的相似距离d1、二值化的模板与待检测字符的相似距离d2;步骤3.3,对d1、d2中的最大值与设定的第四阈值进行对比,若小于设定的第四阈值,则判定该字符与模板字符匹配,否则判定该字符与模板字符不匹配;重复步骤3.2直到选取的字符全部检测完为止,分别统计与各个模板相匹配的字符个数;若没有与模板相匹配的字符,则进行步骤4的检测,否则进行步骤3.4检测;步骤3.4,分别对与各个模板相匹配的字符进行空间位置判断,化学公式中字符的空间位置满足:(1)字符不为上标或者下标;(2)相同字符之间以单键进行连接,无单键相连接的左右相邻的相同字符将进行合并为同一个字符,通过右侧下标数来展示相邻相同字符数;若满足化学公式图像中的空间位置条件,则判定图像为化学公式图像,停止对图像进行检测,若不满足条件,则继续进行步骤4检测;步骤3.4.1,判断匹配字符c是否为图像中其他字符的上标识或者下标识:步骤3.4.1.1,通过S1中分割出的字符的位置判断字符间的位置关系,选取S1中字符高度和宽度均大于第五阈值且字符高度大于匹配字符c高度的字符f,字符c的左边界与字符f的右边界之间的距离小于第六阈值;步骤3.4.1.2,判断字符c的上边界值、下边界值,若字符c的上边界值小于第七阈值,且字符c的下边界位于第七阈值和第八阈值之间,则判定字符c为其他字符的上标识或者下标识,字符c设为无效匹配字符,否则重复步骤3.4.1.1、步骤3.4.1.2,直到S1中无符合条件的字符存在,若字符c不为其他字符的上标识或者下标识,则设为有效匹配字符;对所有的匹配字符进行步骤3.4.1判断,统计与各个模板字符相匹配的有效匹配字符的个数,若有效匹配字符的个数小于第九阈值,则进行步骤4检测,否则进行步骤3.4.2检测;步骤3.4.2,对相同的有效匹配字符进行左右相邻位置判断:步骤3.4.2.1,对相同的字符进行任意两个字符对比,若两字符上边界近似相等,下边界近似相等,且两字符之间的距离小于第十阈值,则进行步骤3.4.2.2检测,否则重复步骤3.4.2.1,直到将全部任意组合进行对比;步骤3.4.2.2,判断两字符的上下两侧是否有其他字符存在;若两字符上下两侧均无字符存在,则两字符位置处于左右相邻...
【专利技术属性】
技术研发人员:杨丽芳,宋格格,黄祥林,陶竹林,刘守训,
申请(专利权)人:中国传媒大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。