职工健康数据采集方法技术

技术编号:32024573 阅读:10 留言:0更新日期:2022-01-22 18:50
职工健康数据采集方法,涉及电子信息技术,尤其是一种多系统数据的采集方法。本发明专利技术的架构包括原始数据层、数据仓库服务层、数据分析服务层和管理云平台层四个层次,其中:原始数据层,用以采集数据;数据仓库服务层,用以对采集到的数据进行存储和计算,并将处理好的数据传输至数据分析层;数据分析服务层,用以分析职工健康数据,然后将分析结果传输至管理云平台层;管理云平台层,用以将分析结果进行业务功能的展示;其中原始数据层的采集依据标准化接口针对各数据采集设备研发数据转换程序进行数据的完整采集。通过本发明专利技术的方法,解决多系统数据多而杂,元数据管理缺失造成数据没办法进行后台数据库的精确采集的问题。没办法进行后台数据库的精确采集的问题。没办法进行后台数据库的精确采集的问题。

【技术实现步骤摘要】
职工健康数据采集方法


[0001]本专利技术涉及电子信息技术,尤其是一种多系统数据的采集方法。

技术介绍

[0002]职工健康管理是通过对职工健康监测、健康评估、健康干预,更好的服务于员工的一种手段。通过健康管理,降低电力职工患病风险,减少医疗费用支出,并间接提高职工生产效率、降低因病对正常工作造成的损失,以及实现加强社保政策的贯彻,最大化的利用社保医疗数据价值,从职工身体健康利益出发的目的。
[0003]在实现职工健康管理的过程中,在大数据环境下,职工体检及门诊会产生大量的数据信息再加上社保基金余额数据,各种数据信息错综复杂,职工健康管理面临着新的挑战。职工健康数据采集是其中一个难度,当前职工健康数据主要存储于体检系统、社保系统、医院his系统。系统经过多年的运行,数据多而杂,元数据管理缺失造成数据没办法进行后台数据库的精确采集。如体检报告的读取与分析也是一个难点,该报告是非结构化数据是以描述性语言来表达的信息。其次健康分析模型的建立也是难点。

技术实现思路

[0004]针对健康数据采集的难点,本专利技术提出一种采集的方法,以解决多系统数据多而杂,元数据管理缺失造成数据没办法进行后台数据库的精确采集的问题。
[0005]职工健康数据采集方法,其特征在于该方法的架构包括原始数据层、数据仓库服务层、数据分析服务层和管理云平台层四个层次,其中:原始数据层,用以采集数据;数据仓库服务层,用以对采集到的数据进行存储和计算,并将处理好的数据传输至数据分析层;数据分析服务层,用以分析职工健康数据,然后将分析结果传输至管理云平台层;管理云平台层,用以将分析结果进行业务功能的展示;其中原始数据层的采集依据标准化接口针对各数据采集设备研发数据转换程序进行数据的完整采集。
[0006]所述的原始数据层采集对象为体检报告,则采用的采集方式是通过运用自然语言处理技术,构建深度学习分析模型,进行文本挖掘,提取文本中的关键内容信息,并进行文本标签提取、标签扩展、内容抽取、内容分类、摘要生成等,实现深度语义分析来采集。
[0007]通过本专利技术的方法,解决多系统数据多而杂,元数据管理缺失造成数据没办法进行后台数据库的精确采集的问题,实现员工、人力资源部门和职工健康云平台的三方互动。它不仅能让每个员工方便、及时地了解自身的健康状况和潜在隐患、积极参与自身健康管理、采取行动改善健康,同时能协助人力资源部门对所有员工的健康状况进行总体评价和掌控,从而在更高层次上管理企业的人力资源。
附图说明
[0008]图1为本专利技术数据采集分析流程图。
具体实施方式
[0009]实施例1:职工健康数据采集方法,采用Spark系统与Hadoop模型进行结合,利用ETL技术、Spark内存计算框架和Spark SQL技术来处理体检、门诊及社保数据,在技术方案中融入OLAP技术,实现不同种类大数据的多维度分析,从不同的角度挖掘数据信息,为企业及员工做出合理提醒及建议、总体架构示意图如图1所示。
[0010]职工健康数据采集方法,架构包括原始数据层、数据仓库服务层、数据分析服务层和管理云平台层四个层次,其中:原始数据层,用以采集数据,主要任务是从体检系统、HIS系统、社保系统中收集数据,通过数据中心获取数据传回职工健康管理云平台服务器。应用ETL技术实现数据的初步处理,将初步处理后的大数据信息输出至数据仓库服务层。
[0011]数据仓库服务层,用以对采集到的数据进行存储和计算,通过Hadoop平台将HDFS系统与Hive数据库结合,利用Spark系统中信息读写技术和计算算法对数据进行高效率地处理,之后将处理好的数据传输至数据分析层。
[0012]数据分析服务层,用以分析职工健康数据,是健康管理云平台中的重要部分,利用该技术能够融合多维数据建模与OLAP技术中的关联规则技术和What

if技术,进而实现职工健康大数据的多维分析,然后将分析结果传输至管理云平台层中实现健康分析、干预等功能。
[0013]管理云平台层,用以将分析结果进行业务功能的展示。
[0014]所述在原始数据层进行数据采集时,依据标准化接口针对各数据采集设备研发数据转换程序进行数据的完整采集。其中,对于体检报告的读取,平台组件包括OCR识别功能模块和NLP文本处理功能模块,对体检报告、体检信息表格等信息进行结构化解析;通过运用自然语言处理技术,构建深度学习分析模型,进行文本挖掘,提取文本中的关键内容信息,并进行文本标签提取、标签扩展、内容抽取、内容分类、摘要生成等,实现深度语义分析。OCR识别功能模块支持业务流程自动化处理中的影像文件,如图片、扫描件的识别处理,支持业务场景下多种类型表格识别,包括无边框表格。支持OCR定制开发能力,能提供定制化的OCR识别处理功能模块。NLP文本处理功能模块支持业务流程自动化处理中的智能文本处理,包括对非结构化文档实现智能文本抽取功能,支持扫描件、PDF、WORD、TXT、EXCEL等多种文件类型。系统需具备非结构化文本的文本抽取模型定制开发能力,能够为业务场景需求开发训练的相应的文本抽取算法模型。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.职工健康数据采集方法,其特征在于该方法的架构包括原始数据层、数据仓库服务层、数据分析服务层和管理云平台层四个层次,其中:原始数据层,用以采集数据;数据仓库服务层,用以对采集到的数据进行存储和计算,并将处理好的数据传输至数据分析层;数据分析服务层,用以分析职工健康数据,然后将分析结果传输至管理云平台层;管理云平台层,用以将分析结果进行业务功能的展示;其中原始数据层...

【专利技术属性】
技术研发人员:徐伟军陆岫昶吴智雯马艳洁易也方继宇
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1