一种基于OCR技术的患者数据识别与采集系统技术方案

技术编号:37470610 阅读:10 留言:0更新日期:2023-05-06 09:50
本发明专利技术公开了一种基于OCR技术的患者数据识别与采集系统,包括图像识别模块、字符训练模块、数据传输模块以及下位机,图像识别模块实现对扫描后图片存档的患者数据进行准确识别,并通过字符训练模块生成的判别模型提升识别准确率,数据传输模块将准确识别的患者数据上传至数据输出模块,下位机通过对患者数据信息进行采集整理后可视化输出。本发明专利技术的优点在于能够节约时间及人力上的成本,并且能够极大大提高纸质档案归档的效率和准确性,具有良好的推广应用价值。的推广应用价值。的推广应用价值。

【技术实现步骤摘要】
一种基于OCR技术的患者数据识别与采集系统


[0001]本专利技术涉及数据识别与采集
,特别涉及一种基于OCR技术的患者数据识别与采集系统。

技术介绍

[0002]在飞速发展的现代社社会, 世界各国越来越重视医疗行业的发展,虽然现在医院信息化水平有了极大地提高,尤其是电子档案的建立。将档案信息数据化,不仅方便保存,而且读取更加便利,但是有些档案信息需要从纸质档案录入到数据库,整个录入过程目前还是处于人工录入阶段。
[0003]众所周知,在现实应用中,医院档案的种类从日常护理信息,到手术信息,种类繁多,医院一天之内产生的纸质档案就是一个非常大的数量,每个岗位的工作人员单独录入本岗位的档案信息也是一件十分耗费时间的工作,在进行纸质档案数据化归档时,还是以人工输入为主,不仅人力成本高,而且效率低。为了节约时间以及人力上的成本,医院引入文字识别进行纸质档案录入的手段是必要的。

技术实现思路

[0004]本专利技术的目的是提供一种基于OCR技术的患者数据识别与采集系统,能够节约时间及人力上的成本,并且能够极大大提高纸质档案归档的效率和准确性,具有良好的推广应用价值。
[0005]本专利技术的上述技术目的是通过以下技术方案得以实现的:一种基于OCR技术的患者数据识别与采集系统,其特征在于,包括图像识别模块、字符训练模块、数据传输模块以及下位机,所述图像识别模块实现对扫描后图片存档的患者数据进行准确识别,并通过字符训练模块生成的判别模型提升识别准确率,数据传输模块将准确识别的患者数据上传至数据输出模块,下位机通过对患者数据信息进行采集整理后可视化输出。
[0006]优选的,所述图像识别模块包括定位模块、分割模块以及识别模块,定位模块从记录患者信息的图像上找出所有有效区域位置并进行保存,分割模块将找出的所有有效区域位置中的字符图像进行预处理后分割形成单字符,识别模块将处理后的单字符进行特征提取,通过字符训练模块生成的判别模型进行匹配识别。
[0007]优选的,定位模块的具体工作流程为:由于患者信息均采用统一格式进行填写,在处理第一帧图片过程中,人工通过鼠标将有效区域圈出,通过鼠标回调函数记录鼠标按键圈出的该区域的位置信息,后续每一帧图片均采用该区域地址图像。
[0008]优选的,所述分割模块的具体工作流程为:先将收集到的区域地址图像进行灰度化,从而让让像素点矩阵中的每一个像素都满足关系R=G=B,形成单通道,再采用最大类间方差阀找到合适的阈值,从而将二值化图像的前景与背景进行区分,从而得到文本信息,后续再通过寻找图像中存在的字符个数实现对单个字符的裁剪。
[0009]优选的,所述识别模块的具体工作流程为:将分割完成的字符进行特征提取,计算hog算子,再通过加载判别模型文件,通过将特征提取后的字符与判别模型中的字符进行匹配,取匹配度最高的结果即为最终的识别结果。
[0010]优选的,所述字符训练模块主要采用机器学习OpenCV库中的CvSvm方法对测试样本进行学习并分类。
[0011]优选的,所述数据传输模块包括数据传输线缆、ZigBee无线通信模块、WiFi无线通信模块以及蓝牙通信模块。
[0012]优选的,所述下位机采用HTTP协议,采用GET方式进行传递字符,下位机收集到数据,首先进行格式检查,将患者各组信息进行分类整理后同步插入至数据库表格内,数据插入完成后,可在下位机可视化界面下调用函数从数据库表中进行查询,并显示在对应的数据类型下。
[0013]优选的,所述图像识别模块采用固定机位设置的摄像头或者扫描仪实现对患者数据文本进行拍摄,采用固定机位设置的摄像头或者扫描仪至少设置有三组,分别与被拍摄的放置面成15
°
、0
°
以及

15
°
的夹角进行拍摄。
[0014]优选的,所述上位机可对原始拍摄图像进行调用,在工作人员对识别与采集数据存疑时,可通过上位机对数据库数据进行及时修改,修改正确后的数据会对字符训练模型生成的判别模型进行校正,不断优化判别模型的准确度。
[0015]综上所述,本专利技术具有以下有益效果:1.本专利技术能够直接快速提取和转换患者的医疗数据信息,可实现对医疗信息数据的快速储存和电子化归档,医疗信息处理和分类工作量小,操作方便,同时便于对医疗信息数据进行备份。
[0016]2.本专利技术在长久使用过程中能够不断对字符训练模型生成的判别模型进行校正,不断优化判别模型的准确度,从而提升OCR技术的识别率、识别速度与识别准确性。
附图说明
[0017]图1是本专利技术的一种基于OCR技术的患者数据识别与采集系统的模块示意图。
具体实施方式
[0018]下面结合附图对本专利技术的具体实施方式作进一步说明,本实施例不构成对本专利技术的限制。
[0019]如图1所述的一种基于OCR技术的患者数据识别与采集系统,包括图像识别模块、字符训练模块、数据传输模块以及下位机,所述图像识别模块实现对扫描后图片存档的患者数据进行准确识别,并通过字符训练模块生成的判别模型提升识别准确率,数据传输模块将准确识别的患者数据上传至数据输出模块,下位机通过对患者数据信息进行采集整理后可视化输出。
[0020]图像识别模块包括定位模块、分割模块以及识别模块,定位模块从记录患者信息的图像上找出所有有效区域位置并进行保存,分割模块将找出的所有有效区域位置中的字符图像进行预处理后分割形成单字符,识别模块将处理后的单字符进行特征提取,通过字符训练模块生成的判别模型进行匹配识别。
[0021]定位模块的具体工作流程为:由于患者信息均采用统一格式进行填写,在处理第一帧图片过程中,人工通过鼠标将有效区域圈出,通过鼠标回调函数记录鼠标按键圈出的该区域的位置信息,后续每一帧图片均采用该区域地址图像。
[0022]分割模块的具体工作流程为:先将收集到的区域地址图像进行灰度化,从而让让像素点矩阵中的每一个像素都满足关系R=G=B,由于RGB 是三通道矩阵,转化为灰度图只有单通道,运算量将大大减少,形成单通道,再采用最大类间方差阀找到合适的阈值,从而将二值化图像的前景与背景进行区分,从而得到文本信息,后续再通过寻找图像中存在的字符个数实现对单个字符的裁剪,通过这一步,能够大大减少了运算量并且更好的得到图片梯度信息,为后续识别进行准备。
[0023]识别模块的具体工作流程为:将分割完成的字符进行特征提取,计算hog算子,再通过加载判别模型文件,通过将特征提取后的字符与判别模型中的字符进行匹配,取匹配度最高的结果即为最终的识别结果。
[0024]字符训练模块主要采用机器学习OpenCV库中的CvSvm方法对测试样本进行学习并分类,特征选用方法则采用方向梯度直方图即hog特征方式进行判断,能够有效提升识别效果,提高准确率。
[0025]数据传输模块包括数据传输线缆、ZigBee无线通信模块、WiFi无线通信模块以及蓝牙通信模块,具体传输方式则根据医院内部的实际情本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于OCR技术的患者数据识别与采集系统,其特征在于,包括图像识别模块、字符训练模块、数据传输模块以及下位机,所述图像识别模块实现对扫描后图片存档的患者数据进行准确识别,并通过字符训练模块生成的判别模型提升识别准确率,数据传输模块将准确识别的患者数据上传至数据输出模块,下位机通过对患者数据信息进行采集整理后可视化输出。2.根据权利要求1所述的一种基于OCR技术的患者数据识别与采集系统,其特征在于:所述图像识别模块包括定位模块、分割模块以及识别模块,定位模块从记录患者信息的图像上找出所有有效区域位置并进行保存,分割模块将找出的所有有效区域位置中的字符图像进行预处理后分割形成单字符,识别模块将处理后的单字符进行特征提取,通过字符训练模块生成的判别模型进行匹配识别。3.根据权利要求2所述的一种基于OCR技术的患者数据识别与采集系统,其特征在于:定位模块的具体工作流程为:由于患者信息均采用统一格式进行填写,在处理第一帧图片过程中,人工通过鼠标将有效区域圈出,通过鼠标回调函数记录鼠标按键圈出的该区域的位置信息,后续每一帧图片均采用该区域地址图像。4.根据权利要求2所述的一种基于OCR技术的患者数据识别与采集系统,其特征在于:所述分割模块的具体工作流程为:先将收集到的区域地址图像进行灰度化,从而让让像素点矩阵中的每一个像素都满足关系R=G=B,形成单通道,再采用最大类间方差阀找到合适的阈值,从而将二值化图像的前景与背景进行区分,从而得到文本信息,后续再通过寻找图像中存在的字符个数实现对单个字符的裁剪。5.根据权利要求1所述的一种基于OCR技术的患者数据识别与采集系统,其特征在于:所述识别模块的具体工作流程为:将分割完成的字符进行特征提取,计算hog...

【专利技术属性】
技术研发人员:徐钊斯
申请(专利权)人:南通静远医药科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1