一种基于贝叶斯估计的职业健康预测系统技术方案

技术编号:36610276 阅读:23 留言:0更新日期:2023-02-08 09:57
本发明专利技术公开了一种基于贝叶斯估计的职业健康预测系统,属于职业健康预测技术领域。本发明专利技术在海量数据分析时,采用了分析效率高、内存资源消耗低、预测误差小的算法模型用于职业健康预测;并采用了高性能和高安全性的非对称ECC算法,保障了用户隐私信息的保护;又通过对多数据源的职业健康数据进行有效整合、筛选、处理,提升了模型的计算性能和预测能力;并利用贝叶斯估计的特点,通过先验概率情况,有效对后验概率进行有效预测,提升预测的准确度;结合用户当前的职业健康状况,对职业健康等级进行了准确的划分,并提供了有效的应对措施。并提供了有效的应对措施。并提供了有效的应对措施。

【技术实现步骤摘要】
一种基于贝叶斯估计的职业健康预测系统


[0001]本专利技术涉及职业健康预测
,具体涉及一种基于贝叶斯估计的职业健康预测系统。

技术介绍

[0002]职业健康的主要工作内容就是研究人类从事各种职业劳动过程中的卫生与健康问题,它以职工的健康在职业活动过程中免受有害因素侵害为目的,其中包括劳动环境对劳动者健康的影响以及防止职业性危害的对策。我国职业卫生形势十分严峻,随着经济的发展,职业卫生安全问题日益加剧,且新发职业病逐渐增多
[0003]近年来,以大数据、云计算、人工智能为代表的新一代数字技术日新月异,工业互联网、物联网、区块链等技术迭代发展,全球正进入“万物互联、泛在智能”的新时代。数字技术踏上了发展的快车道,也给各行各业带来了前所未有的发展契机。数字职业健康和数字医疗是我国数字化产业中的一个机遇和挑战并存的领域,在行业发展层面,产业链上下游要素的数字化升级、改造和转型释放出数字经济的巨大价值,在技术层面,职业健康大数据未得到规范地融合应用,常规的统计学、经验学、案例分析、问卷调查等方法虽然在一定程度上能够分析职业健康存在的风险情况,但是在面对许多复杂类型的人类职业病和大量的数据时,效率不高,误差率偏大,因此,数字职业健康与数字医疗行业急需创新应用层面的关键技术的支撑。
[0004]传统分析职业健康风险的方法存在以下缺点:1)对海量数据分析时,分析效率低、内存资源消耗大、预测误差大;2)不能对用户的隐私进行有效的保护;3)未能综合多种条件因素,并对相关特征进行有效筛选,再进行职业健康建模预测;4)未能基于先验概率情况,有效对后验概率进行有效预测;5)不能根据用户当前的职业健康状况,进行准确的职业健康等级划分,并提供有效的应对措施;6)针对不同类型的职业病,适应性较差,不能迁移到其他类型职业病模型。当前的分析职业健康风险的方法,无法满足当前职业健康分析预测需求。为此,提出一种基于贝叶斯估计的职业健康预测系统。

技术实现思路

[0005]本专利技术所要解决的技术问题在于:如何解决传统分析职业健康风险技术中存在的上述问题,提供了一种基于贝叶斯估计的职业健康预测系统,本系统根据多种职业病影响因素,利用贝叶斯估计算法,实现对用户职业健康风险等级划分,并提供有效的处理应对措施。
[0006]本专利技术是通过以下技术方案解决上述技术问题的,本专利技术包括源数据预处理模块、特征工程模块、贝叶斯模型训练模块、职业健康预测模块、职业健康保障模块;
[0007]所述源数据预处理模块,用于进行信息采集融合、隐私信息脱敏、缺失及异常值处理;
[0008]所述特征工程模块,用于进行特征处理、相关性分析、PCA处理工作;
[0009]所述贝叶斯模型训练模块,用于获取经过特征工程模块处理得到的训练样本,对每个类别计算先验概率,对每个特征属性计算所有值以及计算似然概率,再对每个类别分别计算后验概率,经过多次训练后,获取训练好的贝叶斯模型,即职业健康预测模型;
[0010]所述职业健康预测模块,用于进行基于贝叶斯估计的样本预测及预测效果评估优化工作;
[0011]所述职业健康保障模块,用于根据职业健康模型预测结果提供政府保障措施,并进行工厂环境评估以及提供个人医疗咨询服务。
[0012]更进一步地,所述源数据预处理模块包括信息采集融合单元、隐私信息脱敏单元、缺失及异常值处理单元,所述信息采集融合单元用于将非格式化数据、异构数据转换为格式化、同构数据,所述隐私信息脱敏单元用于采用ECC椭圆加密算法完成隐私数据的加密、解密,其中私钥、公钥由政府监管部门进行管理分发,隐私数据为可以确认用户身份的数据,包括用户姓名、用户身份证号、用户号码,所述缺失及异常值处理单元用于对信息采集融合单元采集的数据进行缺失值填充及异常值删除处理。
[0013]更进一步地,在所述信息采集融合单元中,数据来源包括高校附属医院门诊、企业健康体检、职业健康问卷、政府监管部门以及矿业集团,数据类型分为用户基本信息、工作地信息、用户病史、职业病字典,其中,用户基本信息包括用户身份ID、年龄、性别、身高、体重、职业、行业属性信息,工作地信息包括行业属性、职业健康风险级别信息,用户病史包括用户身份ID、工作年限、职业病类型、当前病情风险等级信息,职业病字典包括行业属性、职业病类型、职业病风险信息。
[0014]更进一步地,所述特征工程模块包括特征处理单元、相关性分析单元、PCA处理单元,所述特征处理单元用于根据脱敏后的用户身份ID和行业属性进行用户信息数据关联,整合出包含用户身份ID、年龄、性别、身高、体重、职业、行业属性、职业健康风险级别、工作年限、职业病类型、当前病情风险等级的相关信息,所述相关性分析单元用于通过特征工程处理后的年龄、性别、BMI、职业、行业属性、职业健康风险级别、工作年限、职业病类型、当前病情风险等级进行相关性分析,设置相关度的阈值为a,自变量之间相关度为b,假如b>a,即删除相关度大于a的特征中的一列,保留其中一列即可,所述PCA处理单元用于通过PCA分析,输出保留信息为设置阈值条件下的特征值向量。
[0015]更进一步地,在特征处理单元进行处理时,处理方式如下:对于年龄、身高、体重、工作年限,属于连续性数据,采用标准化的特征提取方式处理;对于性别、职业、职业健康风险级别、当前病情风险等级,属于分类数据,采用标签编码和序号编码方式处理;对于行业属性、职业病类型,采用独热编码处理;对于职业病类型和当前病情风险等级,为因变量,即贝叶斯模型预测的值,其中,职业病类型为职业性尘肺病及其他呼吸系统疾病、职业性皮肤病、职业性眼病、职业性耳鼻喉口腔疾病、职业性化学中毒、物理因素所致职业病、职业性放射性疾病、职业性传染病、职业性肿瘤、其他职业病,使用0~9表示,当前病情风险等级采用0~4进行表示,0代表安全,1代表轻度风险,2代表中度风险,3代表重度风险,4代表剧度风险。
[0016]更进一步地,在所述职业健康预测模块中,基于贝叶斯估计的样本预测即通过调用训练好的贝叶斯模型对特征工程模块处理得到的测试集进行预测,将预测结果与真实值进行对比,计算出职业健康中职业病类型和当前病情风险等级。
[0017]更进一步地,在所述职业健康预测模块中,预测效果评估优化即根据预测效果借助概率代理模型和采集函数对当前贝叶斯模型进行优化,提升其预测精度。
[0018]更进一步地,所述职业健康保障模块包括政府保障措施单元、工厂环境评估单元、个人医疗咨询单元;所述政府保障措施单元用于政府监管部门了解企业职业健康整体状况,实现对企业进行有效的监管,此外,便于政府对企业员工实施相关的人文关怀政策;所述工厂环境评估单元用于对存在重度、中度职业健康威胁的企业限期进行对生产环境整改,确保相关生产环境指标达标,所述个人医疗咨询单元用于对已患有职业疾病的人员,提供相关医疗帮助,并预测结果存在职业病且当前病情风险等级为轻度及以上,通过政府、企业、医疗机构对其生产环境进行分析,提供预防改善职业疾病方案。
[0019]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于贝叶斯估计的职业健康预测系统,其特征在于,包括:源数据预处理模块、特征工程模块、贝叶斯模型训练模块、职业健康预测模块、职业健康保障模块;所述源数据预处理模块,用于进行信息采集融合、隐私信息脱敏、缺失及异常值处理;所述特征工程模块,用于进行特征处理、相关性分析、PCA处理工作;所述贝叶斯模型训练模块,用于获取经过特征工程模块处理得到的训练样本,对每个类别计算先验概率,对每个特征属性计算所有值以及计算似然概率,再对每个类别分别计算后验概率,经过多次训练后,获取训练好的贝叶斯模型,即职业健康预测模型;所述职业健康预测模块,用于进行基于贝叶斯估计的样本预测及预测效果评估优化工作;所述职业健康保障模块,用于根据职业健康模型预测结果提供政府保障措施,并进行工厂环境评估以及提供个人医疗咨询服务。2.根据权利要求1所述的一种基于贝叶斯估计的职业健康预测系统,其特征在于:所述源数据预处理模块包括信息采集融合单元、隐私信息脱敏单元、缺失及异常值处理单元,所述信息采集融合单元用于将非格式化数据、异构数据转换为格式化、同构数据,所述隐私信息脱敏单元用于采用ECC椭圆加密算法完成隐私数据的加密、解密,其中私钥、公钥由政府监管部门进行管理分发,隐私数据为可以确认用户身份的数据,包括用户姓名、用户身份证号、用户号码,所述缺失及异常值处理单元用于对信息采集融合单元采集的数据进行缺失值填充及异常值删除处理。3.根据权利要求2所述的一种基于贝叶斯估计的职业健康预测系统,其特征在于:在所述信息采集融合单元中,数据来源包括高校附属医院门诊、企业健康体检、职业健康问卷、政府监管部门以及矿业集团,数据类型分为用户基本信息、工作地信息、用户病史、职业病字典,其中,用户基本信息包括用户身份ID、年龄、性别、身高、体重、职业、行业属性信息,工作地信息包括行业属性、职业健康风险级别信息,用户病史包括用户身份ID、工作年限、职业病类型、当前病情风险等级信息,职业病字典包括行业属性、职业病类型、职业病风险信息。4.根据权利要求3所述的一种基于贝叶斯估计的职业健康预测系统,其特征在于:所述特征工程模块包括特征处理单元、相关性分析单元、PCA处理单元,所述特征处理单元用于根据脱敏后的用户身份ID和行业属性进行用户信息数据关联,整合出包含用户身份ID、年龄、性别、身高、体重、职业、行业属性、职业健康风险级别、工作年限、职业病类型、当前病情风险等级的相关信息,所述相关性分析单元用于...

【专利技术属性】
技术研发人员:方贤进杨高明张海永薛明均李想华楷文程颖赵婉婉
申请(专利权)人:安徽理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1