System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种畜禽胴体表皮字符码ocr识别方法及相应地溯源索证方法、设备及系统。
技术介绍
1、ocr(optical character recognition,光学字符识别)是指对文本材料的图像文件进行分析识别处理,以获取文字和版本信息的过程。也就是说将图像中的文字进行识别,并返回文本形式的内容。ocr的技术现在已经很成熟了,尤其是人工智能相关技术层出不穷,ocr也从最早的模板匹配等简单识别方式发展到如今的各种深度神经网络的应用,使得识别率大大提高,误识率和拒识率也随之降低。如今ocr技术应用在各种场景如:文档表格识别、车牌驾照识别、卡证识别、财务票据识别等。
2、图1为胴体表皮喷印溯源码的应用示意图。生猪胴体二分体2表皮内侧为挡板1,用来稳定生猪胴体二分体2的运动和姿态。生猪胴体二分体2表皮外侧为喷码机4和喷码机4的喷嘴3,喷码机4包括喷嘴3和定高滚轮以及同步轮。由于猪肉表皮不平整以及猪肉的厚度也不同,当生猪胴体二分体2运动至喷码打标工位,通过将喷码机4贴到生猪胴体二分体2表皮外侧,然后喷码机4向下运动,向表皮施加一定的压力,使喷嘴3动态地贴近生猪胴体表皮,从而完成喷码打标过程。
3、喷印的溯源码包括字符码、二维码以及检疫合格印章和品质检验合格印章等,在索证环节,通过手机扫描字符码或二维码来索取动物产品检疫合格证和品质检验合格证,如果字符码或二维码不能识别,则索证不成功。字符码的识别主要采用ocr技术。
4、如果字符是在纸张或者电子屏幕等容易辨认在场景,现行的各种ocr技术的识别率几
5、(1)喷印操作不当导致的字符拒识,例如喷码时发生刮擦,导致油墨变形,或者胴体表面油污、毛发等异物堵塞喷头导致有些字符无法辨识。
6、(2)刚屠宰出来的胴体温度和湿度导致喷印墨水发散,字符模糊且发生畸变,导致识别难度加大。
7、(3)胴体表面的喷印区域有褶皱、未刮净的毛发等,导致个别字符丢失。
8、激光灼刻技术用在畜禽胴体表皮打标上,同样也会遇到个别灼刻出来的字符不清楚,字迹模糊的问题,主要原因是灼刻表面的条件并不均匀,如湿度、污渍等。
9、同样,通过针刺在畜禽胴体表皮形成字符码也会由于畜禽胴体表皮存在的起伏、污渍、毛发等情况影响字符码的识别。
10、基于畜禽胴体表皮附着的字符码是畜禽产品市场流通环节中溯源索证的重要基础,综上所述,需要一种专门针对胴体表面喷印的字符进行识别的ocr优化技术,优化后的ocr对个别字符扩散、变形、甚至丢失,都能识别出来,得到完整的溯源字符码。
技术实现思路
1、本专利技术的目的是提供一种畜禽胴体表皮字符码ocr识别方法及相应地溯源方法和索证方法,针对畜禽胴体表皮来优化ocr识别算法,根据特殊标注的文本矩形框和字符集分别训练模型,并且在现有的ocr技术上进行结果集优化,使其能够对喷印在畜禽胴体表皮的辨识度不高甚至丢失的字符进行识别,无论是胴体表面污渍还是喷印不当导致的字符拒识,都能很好的解决,从而完成溯源及索证操作。
2、为了实现本专利技术,本专利技术提供一种畜禽胴体表皮字符码ocr识别方法,所述方法包括,步骤一,ocr识别处理步骤,输入字符码图像,输出文本矩形检测框及其对应的文字,所述字符码由n行m列字符组成,其中n和m为大于1的整数;步骤二,字符码识别步骤,根据所述字符码的几何特征或内容特征,从所述输出的文本矩形检测框中搜索符合所述字符码的几何特征或内容特征的字符码;步骤三,字符码校验步骤,根据设定的校验算法对搜索到的字符码进行校验,校验通过则输出所述字符码。
3、更进一步,所述步骤二还包括检测框缝合步骤,所述检测框缝合步骤根据所述字符码的几何特征,将组成所述字符码中一行或一列的复数个字符文本矩形检测框缝合为完整的一行或一列的文本矩形检测框。
4、更进一步,所述步骤二还包括字符位置定位步骤,根据所述文本矩形检测框的坐标信息把所有字符分割成包含单个字符的文本矩形检测框,根据所述单个字符的文本矩形检测框的坐标计算相互之间的距离,根据相邻两个所述单个字符的文本矩形检测框之间距离判断是否存在空缺字符,如果存在,将所述空缺字符用占位符替代,生成带占位符的字符码。
5、更进一步,在所述字符位置定位步骤之后还包括数据库对比步骤,将在字符码数据库中查询所述带占位符的字符码,从所有查询到的字符码中选择一个作为所述字符码图像对应的字符码。
6、更进一步,所述数据库对比步骤还包括,对所述数据库中存储的一维字符码按照n行m列升维为二维字符码,提取所述二维字符码的二维特征值,提取所述带占位符的字符码的二维特征值,通过比较所述二维特征值来查询所述带占位符的字符码。
7、更进一步,所述数据库对比步骤还包括,对所述带占位符的字符码进行降维,生成一维字符码,将所述一维字符码生成正则表达式在所述数据库中查询,从所有查询到的字符码中选择一个作为所述字符码图像对应的字符码。
8、更进一步,所述数据库对比步骤还包括,降低容易识别错误的字符的相似度阈值,根据可能的结果生成复数个正则表达式,将所述复数个正则表达式在所述数据库中查询,从所有查询到的字符码中选择一个作为所述字符码图像对应的字符码。
9、更进一步,所述n=m=4,所述n行m列字符包括15个字符,其组成的n行字符码对应的字符个数分别为3,4,4,4。
10、更进一步,所述字符码通过喷墨喷码方式固定在所述畜禽胴体表皮。
11、本专利技术还提供一种畜禽胴体溯源索证方法,所述畜禽胴体溯源方法包括所述的畜禽胴体表皮字符码ocr识别方法。
12、本专利技术还提供一种畜禽胴体溯源索证系统,所述溯源索证系统应用了所述的畜禽胴体溯源索证方法。
13、本专利技术还提供一种畜禽胴体溯源索证设备,所述溯源索证设备应用了所述的畜禽胴体溯源索证方法。
14、采用本专利技术的畜禽胴体表皮字符码ocr识别方法、溯源索证方法及系统和设备后,主要有益效果包括:
15、(1)大部分溯源码数据集按照3、4、4、4的组合训练,在推理结果集中能快速排除上下文干扰字符串。
16、(2)对于喷印清晰,但是间隔较远的数字能实现缝合检测框从而组合成3、4、4、4正确排列。
17、(3)根据坐标定位识别到的数字,从编码规则的数据范围中对识别结果补齐或者矫正。
18、(4)根据已识别字符和编码规则从数据库中查询溯源码。
19、(5)在传统ocr所见即能识别的基础上实现肉眼不能辨认也能识别。
本文档来自技高网...【技术保护点】
1.一种畜禽胴体表皮字符码OCR识别方法,其特征在于,所述方法包括,步骤一,OCR识别处理步骤,输入字符码图像,输出文本矩形检测框及其对应的文字,所述字符码由n行m列字符组成,其中n和m为大于1的整数;
2.如权利要求1所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,所述步骤二还包括检测框缝合步骤,所述检测框缝合步骤根据所述字符码的几何特征,将组成所述字符码中一行或一列的复数个字符文本矩形检测框缝合为完整的一行或一列的文本矩形检测框。
3.如权利要求1所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,所述步骤二还包括字符位置定位步骤,根据所述文本矩形检测框的坐标信息把所有字符分割成包含单个字符的文本矩形检测框,根据所述单个字符的文本矩形检测框的坐标计算相互之间的距离,根据相邻两个所述单个字符的文本矩形检测框之间距离判断是否存在空缺字符,如果存在,将所述空缺字符用占位符替代,生成带占位符的字符码。
4.如权利要求3所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,在所述字符位置定位步骤之后还包括数据库对比步骤,将在字符码数据库中查询所述带
5.如权利要求4所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,所述数据库对比步骤还包括,对所述数据库中存储的一维字符码按照n行m列升维为二维字符码,提取所述二维字符码的二维特征值,提取所述带占位符的字符码的二维特征值,通过比较所述二维特征值来查询所述带占位符的字符码。
6.如权利要求4所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,所述数据库对比步骤还包括,对所述带占位符的字符码进行降维,生成一维字符码,将所述一维字符码生成正则表达式在所述数据库中查询,从所有查询到的字符码中选择一个作为所述字符码图像对应的字符码。
7.如权利要求6所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,所述数据库对比步骤还包括,降低容易识别错误的字符的相似度阈值,根据可能的结果生成复数个正则表达式,将所述复数个正则表达式在所述数据库中查询,从所有查询到的字符码中选择一个作为所述字符码图像对应的字符码。
8.如权利要求1至7中任意一项所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,所述n=m=4,所述n行m列字符包括15个字符,其组成的n行字符码对应的字符个数分别为3,4,4,4。
9.如权利要求8所述的畜禽胴体表皮字符码OCR识别方法,其特征在于,所述字符码通过喷墨喷码方式固定在所述畜禽胴体表皮。
10.一种畜禽胴体溯源索证方法,其特征在于,所述畜禽胴体溯源方法包括如权利要求1至9中任意一项所述的畜禽胴体表皮字符码OCR识别方法。
11.一种畜禽胴体溯源索证系统,其特征在于,所述溯源索证系统应用了如权利要求10所述的畜禽胴体溯源索证方法。
12.一种畜禽胴体溯源索证设备,其特征在于,所述溯源索证设备应用了如权利要求10所述的畜禽胴体溯源索证方法。
...【技术特征摘要】
1.一种畜禽胴体表皮字符码ocr识别方法,其特征在于,所述方法包括,步骤一,ocr识别处理步骤,输入字符码图像,输出文本矩形检测框及其对应的文字,所述字符码由n行m列字符组成,其中n和m为大于1的整数;
2.如权利要求1所述的畜禽胴体表皮字符码ocr识别方法,其特征在于,所述步骤二还包括检测框缝合步骤,所述检测框缝合步骤根据所述字符码的几何特征,将组成所述字符码中一行或一列的复数个字符文本矩形检测框缝合为完整的一行或一列的文本矩形检测框。
3.如权利要求1所述的畜禽胴体表皮字符码ocr识别方法,其特征在于,所述步骤二还包括字符位置定位步骤,根据所述文本矩形检测框的坐标信息把所有字符分割成包含单个字符的文本矩形检测框,根据所述单个字符的文本矩形检测框的坐标计算相互之间的距离,根据相邻两个所述单个字符的文本矩形检测框之间距离判断是否存在空缺字符,如果存在,将所述空缺字符用占位符替代,生成带占位符的字符码。
4.如权利要求3所述的畜禽胴体表皮字符码ocr识别方法,其特征在于,在所述字符位置定位步骤之后还包括数据库对比步骤,将在字符码数据库中查询所述带占位符的字符码,从所有查询到的字符码中选择一个作为所述字符码图像对应的字符码。
5.如权利要求4所述的畜禽胴体表皮字符码ocr识别方法,其特征在于,所述数据库对比步骤还包括,对所述数据库中存储的一维字符码按照n行m列升维为二维字符码,提取所述二维字符码的二维特征值,提取所述带占位符的字符码的二维特征值,通过比较...
【专利技术属性】
技术研发人员:尹庆功,李乾,宁尚国,李登亮,
申请(专利权)人:智锐达仪器科技南通有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。