基于健康云管理平台的体检数据智能识别系统及方法技术方案

技术编号:23673483 阅读:54 留言:0更新日期:2020-04-04 18:41
本发明专利技术公开了一种基于健康云管理平台的体检数据智能识别系统及方法,客户端获取体检报告单的图像,并对图像进行预处理、文字特征提取、去噪和清洗识别,得到体检报告单的体检数据,并传输至服务器端;服务器端接收客户端发送的体检数据文件,并对体检数据文件进行预处理,筛选过滤体检数据文件格式,准确性检验,并进行编码,截取体检数据文件的名称,获取健康大数据库的目录信息与体检数据文件的名称进行匹配,将匹配的体检数据文件插入到健康大数据库内,并传输给存储端。本发明专利技术将图像的数据进行数字化转换,实现了健康数据由非数字化到数据的数字化、结构化转化,节省时间成本和人工成本等特点。

Intelligent identification system and method of physical examination data based on health cloud management platform

【技术实现步骤摘要】
基于健康云管理平台的体检数据智能识别系统及方法
本专利技术涉及图像识别领域,尤其是涉及一种基于健康云管理平台的体检数据智能识别系统及方法。
技术介绍
随着科技的发展及社会生活节奏的日益提高,企业员工的健康状况的重要性也日益显露出来。由于各个医疗机构标准不统一,系统不兼容,在搭建电子健康档案汇集健康数据时,如何快速有效的进行医疗体检数据整合以及将一些非结构化的健康数据进行格式化存储是目前围绕电子档案建设的最大难题。如今市场上针对于健康体检医疗资料的读取技术相对缺乏,可供参考的技术资料较少,技术不是很成熟,功能简单,技术使用较为繁琐且精准度不高,并且不能很好的满足健康大数据仓库建设的需求,并且多数需要较大的存储空间进行存储,使用效果和读取加载速度不是很明显。综上所述,现有技术中对于如何快速读取健康数据,减小存储空间的问题,尚缺乏有效技术方案。
技术实现思路
本专利技术提出一种基于健康云管理平台的体检数据智能识别系统及方法,通过图像处理、图像识别、图像理解,将图像的数据进行数字化转换,实现了健康数据由非数字化到数据的数字化、结构化转化,同时解决了对数据的去噪、去重、格式转换、消除异常、压缩、读取以及失败文件二次处理等一系列问题,节省时间成本和人工成本等特点。本专利技术的技术方案是这样实现的:本专利技术的第一目的是提供一种基于健康云管理平台的体检数据智能识别方法,该方法包括以下步骤:客户端获取体检报告单的图像,并对图像进行预处理、文字特征提取、去噪和清洗识别,得到体检报告单的体检数据,并传输至服务器端;服务器端接收客户端发送的体检数据文件,并对体检数据文件进行预处理,筛选过滤体检数据文件格式,准确性检验,并进行编码,截取体检数据文件的名称,获取健康大数据库的目录信息与体检数据文件的名称进行匹配,将匹配的体检数据文件插入到健康大数据库内,并传输给存储端。本专利技术的第二目的是提供一种基于健康云管理平台的体检数据智能识别系统,该系统包括:客户端,用于获取体检报告单的图像,并对图像进行预处理、文字特征提取、去噪和清洗识别,得到体检报告单的体检数据,并传输至服务器端;所述客户端具体被配置为:扫描体检报告单的二维图像;对二维图像进行预处理,包括灰度化、降噪、二值化变换、字符切分和归一化处理;对预处理后的图像进行文字特征提取,得到体检报告单的体检数据,对获得体检报告单的体检数据进行除燥和清洗识别,将清洗后的数据传输至服务器端。服务器端,用于接收客户端发送的体检数据文件,并对体检数据文件进行预处理,筛选过滤体检数据文件格式,准确性检验,并进行编码,截取体检数据文件的名称,获取健康大数据库的目录信息与体检数据文件的名称进行匹配,将匹配的体检数据文件插入到健康大数据库内,并传输给存储端;所述服务器端具体被配置为:接收客户端发送的体检数据文件,并将数据的接收情况记录到日志文件,同时自动进行本地文件备份;待体检数据文件接收完成后,对体检数据文件进行预处理,过滤重复数据;对体检数据文件格式进行整理,使文件名长度一致,筛选处理重复的文件名;将体检数据文件进行编码,生成编码表;截取体检数据文件的名称,从健康大数据库中获取相应文件目录结构信息,将体检数据文件的名称与获取的目录结构进行匹配;若体检数据文件的名称未匹配到目录结构,则删除未匹配的体检数据文件;若体检数据文件的名称匹配到目录结构,则增加时间约束,将匹配的体检数据文件插入到健康大数据库中,并将体检数据文件传输至存储端,删除本地文件,并生成日志文件,记录传输情况。存储端,用于存储体检数据。采用了上述技术方案,本专利技术的有益效果为:(1)本专利技术不仅能进行图像识别,而且将其中噪声数据以及无效数据进行一一识别并清洗,在清洗过程中对缺失的值进行填充并纠正数据中的不一致,为数据抽取提供准确而有效的数据;(2)本专利技术将抽取的数据进行格式化的整理,梳理出标准化的表格,并对派生数据的信息类型进行增强,将格式化数据统一转换成编码,并编写编码表;(3)本专利技术针对实际调试问题及实际业务差异情况进行程序差异性调整,增加时间约束,整理好的数据按照统一的标准整合,形成统一的员工健康数据库;(4)本专利技术能够高效的进行个人健康碎片化数据收集及整合,与个人健康管理平台实现无缝对接,便捷、快速的补充个人健康电子档案,进一步推动健康数据仓库建设。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为基于健康云管理平台的体检数据智能识别系统的结构示意图;图2为基于健康云管理平台的体检数据智能识别方法的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。正如
技术介绍
所介绍的,现有技术针对于健康体检医疗资料的读取技术相对缺乏,可供参考的技术资料较少,技术不是很成熟,功能简单,技术使用较为繁琐且精准度不高,并且不能很好的满足健康大数据仓库建设的需求,并且多数需要较大的存储空间进行存储,使用效果和读取加载速度不是很明显。为了解决如上技术问题,本专利技术提出一种基于健康云管理平台的体检数据智能识别系统及方法,不仅考虑体检数据智能化识别的准确度,而且对不同平台的传输安全性,以及对于体检数据的磁盘存储方式、所需的磁盘空间、快速读取等问题进行了优化。图1是本专利技术实施例一基于健康云管理平台的体检数据智能识别系统的结构框图。如图1所示,该基于健康云管理平台的体检数据智能识别系统包括:客户端,用于扫描体检报告单的二维图像,对包含文字的图像进行处理,包括灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化处理,提取文字特征,获取到体检报告单的体检数据,经过数据的除燥及清洗识别,将清洗后的数据传输到服务器端。所述客户端为具有图像扫描、OCR识别技术的移动设备,是数据传输的发起端。所述客户端采用智能数字化识别技术对历史体检数据和新增体检数据进行批量传输、格式转换、压缩文件等处理,从而减轻体检系统压力,为系统的正常运转提供保障。服务器端,用于接收客户端发送的体检数据文件,并对体检数据文件进行预处理,筛选过滤体检数据文件格式,准确性检验,并进行编码,截取体检数据文件的名称,获取健康大数据库的目录信息与体检数据文件的名称进行匹配,将匹配的体检数据文件插入到健康大数据库内,并传输给存储端。本实施例中,所述服务器端为员工健康云管理平台系统。企业员工健康大数本文档来自技高网
...

【技术保护点】
1.一种基于健康云管理平台的体检数据智能识别方法,其特征是,包括以下步骤:/n客户端获取体检报告单的图像,并对图像进行预处理、文字特征提取、去噪和清洗识别,得到体检报告单的体检数据,并传输至服务器端;/n服务器端接收客户端发送的体检数据文件,并对体检数据文件进行预处理,筛选过滤体检数据文件格式,准确性检验,并进行编码,截取体检数据文件的名称,获取健康大数据库的目录信息与体检数据文件的名称进行匹配,将匹配的体检数据文件插入到健康大数据库内,并传输给存储端。/n

【技术特征摘要】
1.一种基于健康云管理平台的体检数据智能识别方法,其特征是,包括以下步骤:
客户端获取体检报告单的图像,并对图像进行预处理、文字特征提取、去噪和清洗识别,得到体检报告单的体检数据,并传输至服务器端;
服务器端接收客户端发送的体检数据文件,并对体检数据文件进行预处理,筛选过滤体检数据文件格式,准确性检验,并进行编码,截取体检数据文件的名称,获取健康大数据库的目录信息与体检数据文件的名称进行匹配,将匹配的体检数据文件插入到健康大数据库内,并传输给存储端。


2.根据权利要求1所述的基于健康云管理平台的体检数据智能识别方法,其特征是,所述对图像进行预处理的步骤包括:
扫描体检报告单的二维图像;
对二维图像进行预处理,包括灰度化、降噪、二值化变换、字符切分和归一化处理。


3.根据权利要求2所述的基于健康云管理平台的体检数据智能识别方法,其特征是,所述对二维图像进行灰度化处理的步骤包括:
采用浮点算法计算图像第一灰度值;
采用整数方法计算图像第二灰度值,
采用移位方法计算图像第三灰度值;
将二维图像原来的红绿蓝三原色值用第一灰度值、第二灰度值和第三灰度值替换,得到二维图像新的颜色,这样二维图像就为灰度图。


4.根据权利要求2所述的基于健康云管理平台的体检数据智能识别方法,其特征是,所述对图像进行二值化变换的方法为:
计算图像每行的字节数;
将每行的字节数与每列的字节数相替换,
计算图像新的灰度值。


5.根据权利要求1所述的基于健康云管理平台的体检数据智能识别方法,其特征是,对预处理后的图像进行文字特征提取的方法为:
获取样本区域,创建图像矩阵,遍历所有图像矩阵的元素,定位样本,并提取样本;
将所有样本进行缩放,调整样本大小以及参数;
建立样本数据矩阵和样本标签矩阵,将所有样本上添加分类标签,将所有样本上添加数据;
提取并保存体检报告单的体检数据。


6.根据权利要求1所述的基于健康云管理平台的体检数据智能识别方法,其特征是,对得到的体检数据进行除燥和清洗识别的步骤包括:
判断得到的体检数据是否有可编码性;
若体检数据具体可编码性,则分别进行特征追踪和特征判断,对体检数据进行分类。


7.根据权利要求1所述的基于健康云管理平台的体检数据智能识别方法,其特征是,所述服务器端接收客户端发送的体检数据文件后,对体检数据文件进行处理过程为:
接收客户端发送的体检数据文件,并将数据的接收情况记录到日志文件,同时...

【专利技术属性】
技术研发人员:董文杰邢瑞轩侯世朋王立峰潘爱兵于伟李瑞清孙永华李海斌彭楠孟宪鹏
申请(专利权)人:山东鲁能软件技术有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1