一种基于大数据的疾病预测系统技术方案

技术编号:26480760 阅读:24 留言:0更新日期:2020-11-25 19:26
一种基于大数据的疾病预测系统,包括数据获取模块、数据处理模块、疾病预测构建模块、疾病预测模块和信息显示模块,所述数据获取模块用于获取人体生理参数样本数据和患者的生理参数数据,所述数据处理模块分别对获取的样本数据和患者的生理参数数据进行处理,所述疾病预测构建模块采用处理后的人体生理参数样本数据对支持向量机进行训练,获得用于根据人体的生理参数数据进行疾病预测的支持向量机模型,所述疾病预测模块根据处理后的患者的生理参数数据进行疾病预测,所述信息显示模块用于显示预测结果。本发明专利技术创造的有益效果:将大数据技术结合支持向量机应用于疾病预测中,提高了疾病预测的精度。

【技术实现步骤摘要】
一种基于大数据的疾病预测系统
本专利技术创造涉及疾病预测领域,具体涉及一种基于大数据的疾病预测系统。
技术介绍
人体的生理参数数据反应了人体的身体状况,如果能够对获取的生理参数进行有效的分析,就能够更加准确地对疾病进行预测,但是这些生理参数数据的范围较大,涉及的专业领域也较多,如果单纯的通过医生对这些生理参数数据进行分析,不仅要耗费医生大量的精力,还会出现准确率较低的情况。为了使患者对自身的人体状况更加的了解,使医生更加准确地对疾病进行诊断,将大数据技术应用于疾病预测系统中,让其多维化、准确化的处理人体生理参数数据,从而实现了疾病的有效预测。
技术实现思路
针对上述问题,本专利技术旨在提供一种基于大数据的疾病预测系统。本专利技术创造的目的通过以下技术方案实现:一种基于大数据的疾病预测系统,包括数据获取模块、数据处理模块、疾病预测构建模块、疾病预测模块和信息显示模块,所述数据获取模块包括样本数据获取单元和人体数据采集单元,所述样本数据获取单元用于收集人体生理参数样本数据,所述人体数据采集单元用于采集患者的生理参数数据,所述数据处理模块包括第一数据处理单元和第二数据处理单元,所述第一数据处理单元用于对收集的人体生理参数样本数据进行处理,所述第二数据处理单元用于对采集的患者的生理参数数据进行平滑处理,所述疾病预测构建模块采用处理后的人体生理参数样本数据对支持向量机进行训练,获得用于根据人体的生理参数数据进行疾病预测的支持向量机模型,所述疾病预测模块采用构建的支持向量机模型根据处理后的患者的生理参数数据进行疾病预测,所述信息显示模块用于显示疾病预测模块的预测结果。本专利技术创造的有益效果:本专利技术将大数据技术结合支持向量机应用于疾病预测中,采用K均值聚类算法将样本集划分为具有不同聚类中心的样本子集,采用样本子集分别对支持向量机进行训练,避免了由于人体生理参数样本数据的复杂性,而造成的支持向量机学习的复杂性和过拟合;采用粒子群算法对支持向量机的参数进行优化,提高了支持向量机的预测精度。附图说明利用附图对专利技术创造作进一步说明,但附图中的实施例不构成对本专利技术创造的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1是本专利技术结构示意图。具体实施方式结合以下实施例对本专利技术作进一步描述。参见图1,本实施例的一种基于大数据的疾病预测系统,包括数据获取模块、数据处理模块、疾病预测构建模块、疾病预测模块和信息显示模块,所述数据获取模块包括样本数据获取单元和人体数据采集单元,所述样本数据获取单元用于收集人体生理参数样本数据,所述人体数据采集单元用于采集患者的生理参数数据,所述数据处理模块包括第一数据处理单元和第二数据处理单元,所述第一数据处理单元用于对收集的人体生理参数样本数据进行处理,所述第二数据处理单元用于对采集的患者的生理参数数据进行平滑处理,所述疾病预测构建模块采用处理后的人体生理参数样本数据对支持向量机进行训练,获得用于根据人体的生理参数数据进行疾病预测的支持向量机模型,所述疾病预测模块采用构建的支持向量机模型根据处理后的患者的生理参数数据进行疾病预测,所述信息显示模块用于显示疾病预测模块的预测结果。本优选实施例将大数据技术结合支持向量机应用于疾病预测中,采用K均值聚类算法将样本集划分为具有不同聚类中心的样本子集,采用样本子集分别对支持向量机进行训练,避免了由于人体生理参数样本数据的复杂性,而造成的支持向量机学习的复杂性和过拟合;采用粒子群算法对支持向量机的参数进行优化,提高了支持向量机的预测精度。优选地,所述第一数据处理单元采用K均值聚类算法将收集的人体生理参数样本数据划分为L个样本子集,设收集的人体生理参数样本数据组成的样本集为X,且X={X1,X2,…,Xn},其中,n为样本数,Xi为样本集X中的第i个样本数据,设Ω(Xi,Ri)为样本数据Xi的有效局部邻域,其中,Ri表示样本数据Xi的有效局部邻域半径,Ω(Xi,Ri)为以样本数据Xi为球心,以Ri为半径的球形区域,采用迭代的方式确定样本数据Xi的有效局部邻域半径Ri的值:设ri(t)表示第t次迭代时样本数据Xi的局部邻域半径,令ri(t)以步长1进行迭代增加,且样本数据Xi的初始邻域半径ri(0)=minj=1,2,…,n|Xi-Xj|,其中,Xj表示样本集X中的第j个数据,每一次迭代后,对样本数据Xi进行检测,定义样本数据Xi在局部邻域Ω(Xi,ri(t))中的邻域检测系数为P(ri(t)),且P(ri(t))的表达式为:其中,Xg表示局部邻域Ω(Xi,ri(t))中的第g个样本数据,Xa和Xb分别表示样本集X中的第a和第b个样本数据,Ω(Xi,ri(t))表示以样本数据Xi为球心,以ri(t)为半径的球形区域;X(max)表示样本集X中的样本数据的最大值,表示局部邻域Ω(Xi,ri(t))中样本数据的平均值,M(Xi,ri(t))表示局部邻域Ω(Xi,ri(t))中的样本数据个数:给定邻域检测阈值T(ri(t)),且其中,P(ri(j′))表示样本数据Xi在局部邻域Ω(Xi,ri(j′))中的邻域检测系数,ri(j′)表示第j′次迭代时样本数据Xi的局部邻域半径,Ω(Xi,ri(j′))表示以样本数据Xi为球心,以ri(j′)为半径的球形区域,P(ri(j′-1))表示样本数据Xi在局部邻域Ω(Xi,ri(j′-1))中的邻域检测系数,ri(j′-1)表示第(j′-1)次迭代时样本数据Xi的局部邻域半径,Ω(Xi,ri(j′-1))表示以样本数据Xi为球心,以ri(j′-1)为半径的球形区域;当样本数据Xi在第t次迭代时的邻域检测系数P(ri(t))满足:时,令Ri=ri(t),其中,ri(t+1)表示第(t+1)次迭代时样本数据Xi的局部邻域半径,P(ri(t+1))表示样本数据Xi在局部邻域Ω(Xi,ri(t+1))中的邻域检测系数,Ω(Xi,ri(t+1))为以样本数据Xi为球心,以ri(t+1)为半径的球形区域。本优选实施例采用K均值聚类算法将样本集划分为具有不同聚类中心的样本子集,采用样本子集分别对支持向量机进行训练,避免了由于人体生理参数样本数据的复杂性,而造成的支持向量机训练过程的复杂性和过拟合;在采用K均值聚类算法进行聚类时,首先在样本集X中选取L个聚类中心,在考虑样本数据集中的样本数据是否担任聚类中心时,为了减小噪声样本数据对聚类中心选取结果的影响,本优选实施例通过综合考虑样本数据和其局部邻域中的样本数据确定该样本数据是否担任聚类中心,在传统的方式中,对样本集中的所有样本数据都采用统一大小的局部邻域半径,容易造成和样本数据并不属于同一类的邻域样本数据也被归于所述样本数据的局部邻域中,这样选取的聚类中心会影响聚类结果的准确性,针对上述情况,本优选实施例通过定义邻域检测系数对样本数据和其局部邻域内的邻域样本数据进行检测,从而确定所述样本数据的有效局部邻域半径,保证了样本数据和其有效局部邻域本文档来自技高网...

【技术保护点】
1.一种基于大数据的疾病预测系统,其特征是,包括数据获取模块、数据处理模块、疾病预测构建模块、疾病预测模块和信息显示模块,所述数据获取模块包括样本数据获取单元和人体数据采集单元,所述样本数据获取单元用于收集人体生理参数样本数据,所述人体数据采集单元用于采集患者的生理参数数据,所述数据处理模块包括第一数据处理单元和第二数据处理单元,所述第一数据处理单元用于对收集的人体生理参数样本数据进行处理,所述第二数据处理单元用于对采集的患者的生理参数数据进行处理,所述疾病预测构建模块采用处理后的人体生理参数样本数据对支持向量机进行训练,获得用于根据人体的生理参数数据进行疾病预测的支持向量机模型,所述疾病预测模块采用构建的支持向量机模型根据处理后的患者的生理参数数据进行疾病预测,所述信息显示模块用于显示疾病预测模块的预测结果。/n

【技术特征摘要】
1.一种基于大数据的疾病预测系统,其特征是,包括数据获取模块、数据处理模块、疾病预测构建模块、疾病预测模块和信息显示模块,所述数据获取模块包括样本数据获取单元和人体数据采集单元,所述样本数据获取单元用于收集人体生理参数样本数据,所述人体数据采集单元用于采集患者的生理参数数据,所述数据处理模块包括第一数据处理单元和第二数据处理单元,所述第一数据处理单元用于对收集的人体生理参数样本数据进行处理,所述第二数据处理单元用于对采集的患者的生理参数数据进行处理,所述疾病预测构建模块采用处理后的人体生理参数样本数据对支持向量机进行训练,获得用于根据人体的生理参数数据进行疾病预测的支持向量机模型,所述疾病预测模块采用构建的支持向量机模型根据处理后的患者的生理参数数据进行疾病预测,所述信息显示模块用于显示疾病预测模块的预测结果。


2.根据权利要求1所述的一种基于大数据的疾病预测系统,其特征是,所述疾病预测构建模块采用聚类所得的样本子集分别对支持向量机进行训练,并采用粒子群算法对支持向量机的惩罚参数和核函数参数进行优化,设Cj(j=1,2,…,L)表示第一数据处理单元聚类所得的第j个样本子集,且Cj={Xj(i),i=1,2,…,M(Cj)},其中,Xj(i)表示样本子集Cj中的第i个样本数据,M(Cj)表示样本子集Cj中的样本数据个数,设样本子集Cj组成的训练样本集为A,且A={(Xj(i),Qj(i)),i=1,2,…,M(Cj)},设Y={Yj(i),i=1,2,…,M(Cj)}为训练样本集A在支持向量机中的实际输出,定义粒子群算法的适应度函数f的表达式为:



式中,Qj(i)为样本数据Xj(i)在支持向量机中的期望输出,Yj(i)为样本数据Xj(i)在支持向量机中的实际输出。


3.根据权利要求2所述的一种基于大数据的疾病预测系统,其特征是,设粒子群的规模为N,在粒子群中随机选取NA个粒子组成集群A,粒子群中剩余的的粒子组成集群B,设NB表示集群B中的粒子数,NA+NB=1,且0<NA<NB;设置集群A中的粒子采用下式决定下一代的位置:



式中,表示集群A中粒子i在(t+1)时刻的位置,表示集群A中粒子i在t时刻的位置,表示生成服从均值为0,标准差为的正态分布的随机数,设fm(t)表示在t时刻粒子群中粒子适应度值的中值,表示集群A中粒子i在t时刻的位置对应的适应度值,当时,当时,
所述疾病预测构建模块设置寻优检测单元,用于在粒子群算法的每一次迭代后对集群B中的粒子进行检测,定义集群B中粒子i在t时刻的检测系数为且的表达式为:



式中,表示集群B中粒子i在t时刻的位置对应的适应度值,表示集群B中粒子j在t时刻的位置对应的适应度值,f(gB(t))表示集群B中粒子在t时刻的全局最优位置gB(t)对应的适应度值,f(gA(t))表示集群A中粒子在t时刻的全局最优位置gA(t)对应的适应度值;
当f(gA(t))≥f(gB(t))或{(f(gA(t))<f(gB(t)))且时,其中,为给定的检测阈值,且集群B中的粒子i采用下式决定下一代的位置:



式中,和分别表示集群B中粒子i在t时刻的位置和速度,和分别表示集群B中粒子i在(t+1)时刻的位置和速度,表示集群B中粒子i在t时刻的个体最优位置,gB(t)表示集群B中粒子在t时刻的全局最优位置,c1和c2为学习因子,且c1和c2的值均取2,rand()为(0,1)之间的随机数,ω为惯性权重因子;
当且时,集群B中的粒子i采用下式决定下一代的位置:






式中,为随机从集群A中选取的适应度值小于的粒子j在t时刻的位置。


4.根据权利要求1所述的一种...

【专利技术属性】
技术研发人员:王奔
申请(专利权)人:梅里医疗科技洋浦有限责任公司
类型:发明
国别省市:海南;46

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1