一种药品标签日期字符分割方法技术

技术编号:30326652 阅读:20 留言:0更新日期:2021-10-10 00:11
本发明专利技术公开了一种药品标签日期字符分割方法,理想情况下,通过水平投影读取所述每一段闭合曲线的左右端点坐标,依据所述左右端点坐标对所述区域的字符图像进行分割,并删除标点,最后通过归一化处理后完成图像分割;当发生字符粘连时,将分割宽度最大的子图像根据极小值点所在列再次分割,直至子图像个数与实际图像字符个数相同;当发生字符断裂时,绘制出各个子图像中上半部分边缘轮廓的曲线,统计相邻字符间空白区域的宽度,并按照从大到小排序,选取前n个最大的空白区宽度作为有效划分区域进行分割;当子图像个数大于实际不带标点的日期字符个数时,将第n个空白区宽度对应的空白区域删除,并重新划分,直至子图像个数符合实际情况。合实际情况。合实际情况。

【技术实现步骤摘要】
一种药品标签日期字符分割方法


[0001]本专利技术涉及图像分割识别
,主要涉及一种药品标签日期字符分割方法。

技术介绍

[0002]现有对药品标签日期的识别技术中,标签日期区域分割出来后,需要将每个字符单独分割出来,常用的字符分割法有投影法、连通域法等。连通域法基于每个数字都是单连通的,找到每个连通域的最小外接矩形即可把每个字符单独分割出来。投影法基于相邻两个字符间都有一个空白的间隔区域,将待分割图像水平投影,统计每一列黑色像素点的数目,黑色像素点数目为0的区域为字符间的空白区,以空白区作为间隔将进行字符分割。理性情况下,投影法和连通域法都能简单快速的将字符分割出来。但由于打印字符时可能会出现字符粘连在一起或是断裂的情况,因此需要专利技术一种在粘连、断裂等特殊情况的字符分割方法,以提高后续字符识别的准确率。

技术实现思路

[0003]专利技术目的:针对上述
技术介绍
中存在的问题,本专利技术提供了一种药品标签日期字符分割方法,在传统投影法的基础上,针字符出现粘连、断裂等不同情况,分别提出了针对无粘连、断裂的标准字符、粘连字符和断裂字符的分割方法,实现不同情况下准确分割字符图像,可以有效提升字符识别的准确率。
[0004]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0005]一种药品标签日期字符分割方法,包括以下步骤:
[0006]步骤S1、将初步采集到的带有药品标签日期字符的区域进行水平投影,获取水平投影图;所述水平投影图包括若干段与坐标横轴相闭合的曲线,读取所述每一段闭合曲线的左右端点坐标,即为该区域每个字符的端点坐标,依据所述左右端点坐标对所述区域的字符图像进行分割,获得若干代表字符的子图像;统计分割后的子图像个数,当分割图个数等于实际带标点的日期字符个数时,区域分割正确;
[0007]步骤S2、对分割后的各子图像进行纵向投影,删除每个字符上下的空白区域,同时将纵向投影图中高度低于预设阈值的部分作为标点,删除对应的子图像;
[0008]步骤S3、将分割后的不带标点的子图像进行大小归一化处理,采用最邻近插值法对每个子图像进行几何变换,将日期字符变换为固定规格的大小,完成分割。
[0009]进一步地,,当统计分割后的子图像个数低于实际带标点的日期字符个数时,判断存在字符粘连情况,采用以下分割方法:
[0010]步骤L1、选取分割后宽度最大的子图像,根据所述子图像的水平投影图,统计每一列中黑色像素点个数,获取黑色像素点个数的分布曲线图;
[0011]步骤L2、选取所述分布曲线图中的极小值点,将各极小值点中最小的极小值点所在的列作为两个粘连字符的分割线,以所述分割线将该子图像分为两部分;
[0012]步骤L3、重复上述步骤L1

L2,直至所述子图像个数等于实际带标点的日期字符个
数;
[0013]步骤L4、重复步骤S2

S3,完成图像分割。
[0014]进一步地,当统计分割后的子图像个数高于实际带标点的日期字符个数时,判断存在字符断裂情况,采用以下分割方法:
[0015]步骤M1、绘制出各个子图像中上半部分边缘轮廓的曲线,统计相邻字符间空白区域的宽度,并按照从大到小排序,选取前n个最大的空白区宽度,其中n=m

1,m为实际带标点的日期字符个数;当第n个空白区宽度对应的空白区域数量大于1时,将所述空白区域划全部划分为有效空白区域;
[0016]步骤M2、根据所述有效空白区域按步骤S1中的分割方法对图像进行分割,生成若干子图像,将子图像中黑色像素点最大高度低于预设阈值的部分作为标点,删除对应的子图像;统计删除后的子图像个数N;
[0017]步骤M3、当N大于实际不带标点的日期字符个数时,将第n个空白区宽度对应的空白区域删除,视为无效分割区,重复步骤M1

M2,直至N小于等于实际不带标点的日期字符个数;当N等于实际不带标点的日期字符个数,分割正确,当N小于实际不带标点的日期字符个数时,即按照出现字符粘连的情况进行分割;
[0018]步骤M4、对分割好的不带标点的子图像重复步骤S3,完成分割。
[0019]有益效果:
[0020]本专利技术针对现有图像分割技术中字符粘连或断裂时容易影响图像分割准确度的问题,提供了不同情况下的分割方法,与现有投影法相比,本专利技术分别采用基于极小值再分割和基于空白区再分割的方法解决了字符粘连和断裂时的分割准确度问题,有效提高后续字符识别的准确率。
附图说明
[0021]图1是本专利技术提供的理想情况下水平投影图;
[0022]图2是本专利技术实施例中理想情况下分割后的带标点的子图像;
[0023]图3是本专利技术实施例中理想情况下经过归一化处理后不带标点的子图像;
[0024]图4是本专利技术实施例中出现字符粘连时的待分割图像示意图;
[0025]图5是本专利技术实施例中每列黑色像素点个数的分布曲线图;
[0026]图6是本专利技术实施例中出现字符断裂时的待分割图像示意图;
[0027]图7是本专利技术实施例中图像上半部分边缘轮廓的曲线;
[0028]图8是本专利技术实施例中空白区宽度统计图;
[0029]图9是本专利技术实施例中字符断裂情况下的分割结果示意图。
具体实施方式
[0030]下面结合附图对本专利技术作更进一步的说明。
[0031]本专利技术提供的药品标签日期字符分割方法,分别针对理想情况和实际可能出现的字符粘连和字符断裂的情况,提供详细的药品标签日期字符分割方法,下面依据具体实施例,首先介绍理想情况下的药品标签日期字符分割方案:
[0032]步骤S1、将初步采集到的带有药品标签日期字符的区域进行水平投影,获取水平
投影图如图1所示。水平投影图中包括若干段与坐标横轴相闭合的曲线,读取所述每一段闭合曲线的左右端点坐标,即为该区域每个字符的端点坐标,根据投影曲线得到每个字符的左端点和右端点坐标,以此将每个字符分割出来,获得若干代表字符的子图像。统计分割后的子图像个数,当分割图个数等于实际带标点的日期字符个数时,区域分割正确,即为理想分割情况。分割后的字符示例如图2所示,此时分割图个数等于10。
[0033]步骤S2、对分割后的各子图像进行纵向投影,删除每个字符上下的空白区域,同时将纵向投影图中高度低于预设阈值的部分作为标点,删除对应的子图像;
[0034]步骤S3、将分割后的不带标点的子图像进行大小归一化处理,采用最邻近插值法对每个子图像进行几何变换,将日期字符变换为固定规格的大小,完成分割。本实施例中将固定大小设置为25*50。处理后的图像如图3所示。
[0035]下面介绍当出现字符粘连的情况时采用的分割方法。
[0036]在理想情况下,分割图个数等于实际带标点的日期字符个数,实际字符粘连时,分割后的子图像个数低于实际带标点的日期字符个数,如图4所示,应当采用以下分割方法:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种药品标签日期字符分割方法,其特征在于,包括以下步骤:步骤S1、将初步采集到的带有药品标签日期字符的区域进行水平投影,获取水平投影图;所述水平投影图包括若干段与坐标横轴相闭合的曲线,读取所述每一段闭合曲线的左右端点坐标,即为该区域每个字符的端点坐标,依据所述左右端点坐标对所述区域的字符图像进行分割,获得若干代表字符的子图像;统计分割后的子图像个数,当分割图个数等于实际带标点的日期字符个数时,区域分割正确;步骤S2、对分割后的各子图像进行纵向投影,删除每个字符上下的空白区域,同时将纵向投影图中高度低于预设阈值的部分作为标点,删除对应的子图像;步骤S3、将分割后的不带标点的子图像进行大小归一化处理,采用最邻近插值法对每个子图像进行几何变换,将日期字符变换为固定规格的大小。2.根据权利要求1所述的一种药品标签日期字符分割方法,其特征在于,当统计分割后的子图像个数低于实际带标点的日期字符个数时,判断存在字符粘连情况,采用以下分割方法:步骤L1、选取分割后宽度最大的子图像,根据所述子图像的水平投影图,统计每一列中黑色像素点个数,获取黑色像素点个数的分布曲线图;步骤L2、选取所述分布曲线图中的极小值点,将各极小值点中最小的极小值点所在的列作为两个粘连字符的分割线,以所述分割线将该子图像分为两部分;步骤L3、重复上述步骤L1

【专利技术属性】
技术研发人员:王敏秦永敏刘晨选王康庄志豪李晟吴佳孙硕钱昕宇张雨辰
申请(专利权)人:苏州敏捷机器人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1