一种结构化处方图片识别方法及装置制造方法及图纸

技术编号：28376004 阅读：28 留言：0更新日期：2021-05-08 00:03

本发明专利技术公开了一种结构化处方图片识别方法及装置，其中方法包括：获取待录入处方图片；对待录入处方图片进行区域标记并切割，得到多个第一待识别区域图像；根据区域标记的关联性对第一待识别区域图像进行分类；根据类别拼接第一待识别区域图像，得到第二待识别区域图像；对第二待识别区域图像进行文字识别；根据预设匹配模式将第二待识别区域图像的文字信息与电子文档所对应的位置进行绑定。通过对处方图像标记区域的重新拼接，提升了识别的精确度和完整度，使得整个处方需要识别的地方不漏识，不需要识别的地方不多识，提高了处方图像识别录入的自动化程度及处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种结构化处方图片识别方法及装置
本专利技术涉及图像处理
，具体涉及一种结构化处方图片识别方法及装置。
技术介绍
现阶段处方录入的方式主要有两种，一种是人工手动录入，另一种是通过文字视觉识别技术，即光学字符识别（OpticalCharacterRecognition，OCR）技术对处方进行识别，然后自动录入。但是对于OCR识别来说，仅仅是识别出了文字，后续录入还是需要人工处理、精确匹配信息，自动化程度不够高，处理效率较低。
技术实现思路
有鉴于此，本专利技术实施例提供了一种结构化处方图片识别方法及装置，以解决现有技术中OCR识别对于处方图像自动录入的效率不够高的问题。本专利技术实施例提供了一种结构化处方图片识别方法，包括：获取待录入处方图片；对待录入处方图片进行区域标记并切割，得到多个第一待识别区域图像；根据区域标记的关联性对第一待识别区域图像进行分类；根据类别拼接第一待识别区域图像，得到第二待识别区域图像；对第二待识别区域图像进行文字识别；根据预设匹配模式将第二待识别区域图像的文字信息与电子文档所对应的位置进行绑定。可选地，预设匹配模式为：当第二待识别区域图像包含的文字数据小于预设值时，根据第二待识别区域图像与第一模板区域的交并比进行匹配；若交并比的比值超过预设阈值，则判定为匹配成功；当第二待识别区域图像包含的文字数据大于预设值时，判断第二待识别区域图像是否包含于第二模板区域中的标记区域；>若第二待识别区域图像包含于第二模板区域中的标记区域，则判定为匹配成功。可选地，预设阈值为60%。可选地，在对待录入处方图片进行区域标记并切割，得到多个待识别区域图像之前，还包括：将录入处方图片根据模板处方进行透视与矫正，使录入处方图片的内容与模板处方对齐。可选地，还包括：对模板处方进行标记，赋予不同位置文字信息对应的文字属性；其中，文字属性包括医院名称、科室名称、患者信息和诊断结果中的至少一者。可选地，根据区域标记的关联性拼接多个待识别区域图像包括：将多个待识别区域图像按行排列，使每一行仅有一个连续的识别区域。可选地，根据类别拼接第一待识别区域图像，得到第二待识别区域图像还包括：用像素值为255的图像填充第二待识别区域图像的右侧、下侧和右下侧区域，使第二待识别区域图像中的单个待识别文字的像素数量所占总像素数量的比例降低，以提高待识别文字的分辨率至300dpi~400dpi。在本实施例中，可选地，预设值为二十个字符。本专利技术实施例还提供了一种结构化处方图片识别装置，包括：模板标记模块，用于对模板处方进行标记，赋予不同位置文字信息对应的文字属性；图像处理模块，用于对待录入处方图片进行区域标记并切割，得到多个第一待识别区域图像；图像处理模块还用于根据同模板处方区域标记的关联性拼接多个第一待识别区域图像，得到多个第二待识别区域图像；文字识别模块，用于对第二待识别区域图像进行文字识别；模板匹配模块，用于根据位置信息和/或识别出的文字内容，将第二待识别区域图像的文字信息与电子文档所对应的含义进行绑定。本专利技术实施例提供了一种结构化处方图片识别方法，有益效果如下：1、通过对处方图像标记区域的重新拼接，提升了识别的精确度和完整度，使得整个处方需要识别的地方不漏识，不需要识别的地方不多识，提高了处方图像识别录入的自动化程度及处理效率。2、通过模板匹配，提升了匹配精准度，使得识别的文字与所代表的含义能够精准匹配，显著减少了错误匹配、漏匹配、多匹配的现象，显著减少人对识别后的处方的二次处理，极大的提升了工作效率。附图说明通过参考附图会更加清楚的理解本专利技术的特征和优点，附图是示意性的而不应理解为对本专利技术进行任何限制，在附图中：图1示出了一种结构化处方图片识别方法的流程图；图2示出了一种结构化处方图片识别装置的结构图；图3示出了一种结构化处方图片识别终端的结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚，下面将结合本专利技术实施例中的附图，对本专利技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本专利技术一部分实施例，而不是全部的实施例。基于本专利技术中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本专利技术保护的范围。实施例1如图1所示，本专利技术实施例提供了一种结构化处方图片识别方法，包括：步骤S10，获取待录入处方图片。在本实施例中，还包括预处理步骤，目的为图像降噪，除去图像噪音，以便于后续操作。步骤S20，对待录入处方图片进行区域标记并切割，得到多个第一待识别区域图像。在本实施例中，切割方法通过提取待录入图片中包含处方信息的最小区域四边形来实现：在包含处方信息的图像轮廓上找出两个点，记为点A和点B；连接点A和点B，形成第一线段；在轮廓上查找距离第一线段距离最远的点C和次远的点D；依次连接点A、点D、点B和点C，形成最小区域四边形ADBC。轮廓的多边形逼近指的是：使用多边形来近似表示一个轮廓。多边形逼近的目的是为了减少轮廓的顶点数目。多边形逼近的结果依然是一个轮廓，只是这个轮廓相对要粗旷一些。步骤S30，根据区域标记的关联性对第一待识别区域图像进行分类。在本实施例中，关联性程度根据模板匹配的设置来排序划分。步骤S40，根据类别拼接多个第一待识别区域图像，得到多个第二待识别区域图像。在本实施例中，第二待识别区域图像由同一类别的至少一个第一待识别区域图像组成。根据类别，将较小的多个第一待识别区域图像进行拼接，得到多个较大的第二待识别区域图像。在后续文字识别过程中，用固定大小的模板进行识别，图像中包含的像素越多、分辨率则越高，也即这张图像越清晰，文字也越容易识别出来。步骤S50，对第二待识别区域图像进行文字识别。在本实施例中，通过OCR进行文字识别。步骤S60，根据预设匹配模式将第二待识别区域图像的文字信息与电子文档所对应的位置进行绑定。在本实施例中，将OCR文字识别后得出的每一个识别区域，与图像处理模块新生成的图片中的每一个标记块的位置进行匹配，若匹配成功，则将识出的每一个区域的文字内容与该区域所对应的含义做绑定。在具体实施例中，将模板匹配模块绑定好的数据格式化为网络通信中常用的json格式，以便于之后数据的处理、加工和传输。本实施例通过对处方图像标记区域的重新拼接，提升了识别的精确度和完整度，使得整个处方需要识别的地方不漏识，不需要识别的地方不多识，提高了处方图像识别录入的自动化程度及处理效率。作为可选的实施方式，预设匹配模式为：当第二待识别区域图像包含的文字数据小于预设值时，根据第二待识别区域图像与第一模板区域的交并比进行匹配；若交并比的比值超过预设阈值，则判定为匹配成功；具体的本文档来自技高网...

【技术保护点】
1.一种结构化处方图片识别方法，其特征在于，包括：/n获取待录入处方图片；/n对所述待录入处方图片进行区域标记并切割，得到多个第一待识别区域图像；/n根据区域标记的关联性对所述第一待识别区域图像进行分类；/n根据类别拼接所述第一待识别区域图像，得到第二待识别区域图像；/n对所述第二待识别区域图像进行文字识别；/n根据预设匹配模式将所述第二待识别区域图像的文字信息与电子文档所对应的位置进行绑定。/n

【技术特征摘要】
1.一种结构化处方图片识别方法，其特征在于，包括：
获取待录入处方图片；
对所述待录入处方图片进行区域标记并切割，得到多个第一待识别区域图像；
根据区域标记的关联性对所述第一待识别区域图像进行分类；
根据类别拼接所述第一待识别区域图像，得到第二待识别区域图像；
对所述第二待识别区域图像进行文字识别；
根据预设匹配模式将所述第二待识别区域图像的文字信息与电子文档所对应的位置进行绑定。

2.根据权利要求1所述的结构化处方图片识别方法，其特征在于，所述预设匹配模式为：
当所述第二待识别区域图像包含的文字数据小于预设值时，根据所述第二待识别区域图像与第一模板区域的交并比进行匹配；
若所述交并比的比值超过预设阈值，则判定为匹配成功；
当所述第二待识别区域图像包含的文字数据大于所述预设值时，判断所述第二待识别区域图像是否包含于第二模板区域中的标记区域；
若所述第二待识别区域图像包含于第二模板区域中的标记区域，则判定为匹配成功。

3.根据权利要求1所述的结构化处方图片识别方法，其特征在于，所述预设阈值为60%。

4.根据权利要求1所述的结构化处方图片识别方法，其特征在于，在对所述待录入处方图片进行区域标记并切割，得到多个待识别区域图像之前，还包括：
将所述录入处方图片根据模板处方进行透视与矫正，使所述录入处方图片的内容与所述模板处方对齐。

5.根据权利要求4所述的结构化处方图片识别方法，其特征在于，还包括：对所述...

【专利技术属性】
技术研发人员：赵鑫，焦小斌，
申请(专利权)人：苏州艾隆科技股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人