用于执行光学字符识别的装置和方法制造方法及图纸

技术编号:28296570 阅读:45 留言:0更新日期:2021-04-30 16:21
本申请涉及用于执行光学字符识别的装置和方法,具体涉及一种用于在光学字符识别过程中执行字符隔离的方法,所述方法包括:接收表示一个或多个字符列的图像数据;确定图像数据中每一列的黑色像素的数目;定义竖向分开阈值,该竖向分开阈值是列中黑色像素的最大数目;通过排除黑色像素数目低于竖向分开阈值的任何列,将列划分成不同的像素组和排除列组;识别表示图像数据中最左侧字符列的像素组;确定图像数据中有一个还是两个表示字符列的像素组;以及如果确定存在两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。

【技术实现步骤摘要】
用于执行光学字符识别的装置和方法本申请是基于申请日为2015年07月09日,申请号为201580048263.2(国际申请号为PCT/EP2015/065669)、名称为“用于执行光学字符识别的装置和方法”的专利技术专利申请的分案申请。
本专利技术涉及一种用于执行光学字符识别(OCR)的装置和方法。该装置可为用于附接到例如注射装置等医疗装置并且与医疗装置一起使用的辅助装置。
技术介绍
在医疗装置领域中,在需要非常高的精度的情况下不常使用OCR技术,例如以防止药物的误配给。因此,许多基于机械的装置也具有剂量标尺或读数,其必须人工读取并且人工记录剂量。这对于用户来说是耗时的,并且可能潜在地导致错误。此外,如果要以电子方式传送数据和/或以电子方式分析数据,则必须首先将数据人工输入到单独的电子装置中。此外,一些患者(例如视力差的患者)可能难以读取通常较小的机械读数。存在多种疾病需要通过注射药剂进行定期治疗。这种注射可以通过使用注射装置来进行,由医务人员或患者自己注射。作为一个示例,1型和2型糖尿病可以由患者自己通过注射胰岛素剂量来治疗,例如每天一次或多次。例如,预填充的一次性胰岛素笔可以用作注射装置。作为替代,可以使用可重复使用的笔。可重复使用的笔允许用新的药筒更换空药物筒。任一种笔可以带有一套一次性针,在每次使用之前更换。然后可以例如通过转动剂量旋钮并从胰岛素笔的剂量窗口或显示器观察实际剂量,在胰岛素笔处手动选择要注射的胰岛素剂量。然后通过将针插入适当的皮肤部分并按压胰岛素笔的注射按钮来注射剂量。为了能够监视胰岛素注射,例如以防止对胰岛素笔的错误操作或者保持跟踪已经应用的剂量,期望测量与注射装置的状况和/或使用相关的信息,例如关于所注射的胰岛素类型和剂量的信息。
技术实现思路
本专利技术的第一方面提供了一种在光学字符识别过程中执行字符隔离的方法,所述方法包括:接收表示一个以上字符列的图像数据;确定所述图像数据的每一列中的黑色像素的数目;定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;通过排除黑色像素数目低于所述竖向分开阈值的任何列,将这些列划分为不同的像素组和排除列组;识别表示所述图像数据中最左侧字符列的像素组;确定所述图像数据中有一个还是两个表示字符列的像素组;以及如果确定有两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。此方法允许最右侧字符列中的字符被正确地分割和隔离,即使它们与右手边距/框线区域合并。对图像数据中的字符的正确分割和隔离允许执行准确且可靠的OCR过程,这对于在医疗应用中使用OCR技术特别重要。识别图像数据中表示最左侧字符列的像素组可以包括识别紧邻最左侧排除列组右边的像素组。识别图像数据中表示最左侧字符列的像素组可以包括:如果紧邻最左侧排除列组右边的像素组小于最小数字宽度阈值,则排除该像素组,因而将在最左侧排除列组右边的第二像素组定义为图像数据中的最左侧字符列。该过程考虑(并且忽略)了在可以使用字符隔离方法的许多装置中印制在“0”和“2”之间较小的“1”。确定图像数据中有一个还是两个表示字符列的像素组,可以包括确定最左侧排除列组的宽度。最左侧排除列组表示最左数字组左边的空白空间。该区域的宽度取决于可见数码是否各自包括一个或两个数字。如果确定最左侧排除列组的宽度小于最大左边距阈值,则该方法还可以包括确定在图像数据中有两个表示字符列的像素组。该方法还可以包括确定图像数据中最左侧字符列的宽度。该方法还可以包括使用所确定的图像数据中最左侧字符列的宽度,来确定最左侧字符列是仅包括窄的数码还是仅包括宽的数码。如果确定最左侧字符列仅包括窄的数码,则该方法还可以包括将最大有效剂量结果设置为“19”。由于数吗“1”在宽度上与每一个其他数码明显不同,因此对于随后的OCR过程的精度来说,识别最左数字是否为“1”是重要的。该方法还可以包括排除接触图像左手边缘的任何像素组。在一些情况下,可能存在应当被识别为不表示字符数据并且应被排除的左手边框区域。该方法还可以包括通过识别位于左手字符列和右手字符列之间的排除列组,来识别右手字符列的左手边界。该过程识别一个两位数中的数字之间的间隙。OCR算法可以要求每个数字被隔离以便被正确地识别。该方法还可以包括确定左手字符列是否比最大数字宽度阈值宽,如果是,则确定图像数据中的数码在8到10的范围内。这种情况可能发生在数码“8”能够在数码“10”之上或之下在图像数据中看见。在这种情况下,很难将字符分开成列。然而,通过将潜在有效结果限制为“8”、“9”或“10”,仍然可以返回精确的结果。本专利技术的第二方面提供了一种用于在光学字符识别过程中执行字符隔离的处理器,所述处理器配置为:接收表示一个以上字符列的图像数据;确定所述图像数据的每一列中的黑色像素的数目;定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;通过排除黑色像素数目低于竖向分开阈值的任何列,将列划分为不同的像素组和排除列组;识别所述图像数据中表示最左侧字符列的像素组;确定所述图像数据中有一个还是两个表示字符列的像素组;以及如果确定有两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。处理器可以被配置为通过识别紧邻最左侧排除列组右边的像素组来识别表示图像数据中最左侧字符列的像素组。处理器可以被配置为通过确定最左侧排除列组的宽度来确定图像数据中有一个还是两个表示字符列的像素组。本专利技术的第三方面提供了一种用于附接到注射装置的辅助装置,所述辅助装置包括:成像组件,所述成像组件被配置为捕获存在于所述注射装置的可移动部件上的一个以上数的图像;以及根据本专利技术第二方面的处理器。具体地,本专利技术涉及如下各项:1.一种用于在光学字符识别过程中执行字符隔离的方法,所述方法包括:接收表示一个以上字符列的图像数据;确定所述图像数据中每一列的黑色像素的数目;定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;通过将黑色像素数目低于所述竖向分开阈值的任何列排除,将列划分为不同的像素组和排除列组;识别所述图像数据中表示最左侧字符列的像素组;确定所述图像数据中有一个还是两个表示字符列的像素组;以及如果确定有两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。2.根据项1所述的方法,其中,识别所述图像数据中表示最左侧字符列的像素组包括:识别紧邻最左侧排除列组右边的像素组。3.根据项1所述的方法,其中,识别所述图像数据中表示最左侧字符列的像素组包括:如果紧邻最左侧排除列组右边的像素组低于最小数字宽度阈值,则排除所述紧邻最左侧排除列组右边的像素组,因而将最左侧排除列组右边的第二像素组定义为所述图像数据中的最左侧字符列。4.根据项本文档来自技高网
...

【技术保护点】
1.一种用于在光学字符识别过程中执行字符隔离的方法,所述方法包括:/n接收表示一个以上字符列的图像数据;/n确定所述图像数据的每一列中黑色像素的数目;/n定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;/n通过将黑色像素数目低于所述竖向分开阈值的任何列排除,而将列划分为不同的像素组和排除列组;/n识别所述图像数据中表示最左侧字符列的像素组,其进一步包括:/n识别最左侧的排除列组;/n确定紧邻最左侧排除列组的右边的像素组低于最小数字宽度阈值;和/n排除所述紧邻最左侧排除列组的右边的像素组。/n

【技术特征摘要】
20140710 EP 14176482.91.一种用于在光学字符识别过程中执行字符隔离的方法,所述方法包括:
接收表示一个以上字符列的图像数据;
确定所述图像数据的每一列中黑色像素的数目;
定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;
通过将黑色像素数目低于所述竖向分开阈值的任何列排除,而将列划分为不同的像素组和排除列组;
识别所述图像数据中表示最左侧字符列的像素组,其进一步包括:
识别最左侧的排除列组;
确定紧邻最左侧排除列组的右边的像素组低于最小数字宽度阈值;和
排除所述紧邻最左侧排除列组的右边的像素组。


2.根据权利要求1所述的方法,其包括确定最左侧排除列组的右边的第二像素组作为所述图像数据中的最左侧字符列。


3.根据权利要求1或2所述的方法,其包括确定所述图像数据中是否有表示字符列的一个或两个像素组。


4.根据权利要求1-3中任一项所述的方法,其中确定所述图像数据中是否有表示字符列的一个或两个像素组包括确定最左侧排除列组的宽度。


5.根据权利要求4所述的方法,其中如果确定所述最左侧排除列组的宽度低于最大左边距阈值,则确定所述图像数据中有表示字符列的两个像素组。


6.根据前述权利要求中任一项所述的方法,所述方法还包括确定所述图像数据中的最左侧字符列的宽度。


7.根据权利要求6所述的方法,所述方法还包括使用所确定的所述图像数据中的最左侧字符列的宽度,来确定最左侧字符列是仅包括窄的数码还是包括宽的数码。


8.根据权利要求7所述的方法,其中如果确定最左侧字符列仅包括窄的数码,则将最大有效剂量结果设置为“19”。


9.根据前述权利要求中任一项所述的方法,所述方法还包括将接触所述图像的左手边界的任何像素组排除。

<...

【专利技术属性】
技术研发人员:D·哈门
申请(专利权)人:赛诺菲安万特德国有限公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1