System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及疾病预测,更具体地涉及一种基于算法和大数据的疾病预测系统。
技术介绍
1、人体的生理参数数据反映了人体的身体状况,如果能够对获取的生理参数进行有效的分析,就能够更加准确地对疾病进行预测,但是这些生理参数数据的范围较大,为了使患者对自身的人体状况更加的了解,使医生更加准确地对疾病进行诊断,将大数据技术应用于疾病预测系统中,让其多维化、准确化的处理人体生理参数数据,能够实现对疾病的有效预测。
2、在公开号为cn111986811b的申请文件中,通过获取人体生理参数样本数据和患者的生理参数数据,对支持向量机进行训练,获得用于根据人体的生理参数数据进行疾病预测的支持向量机模型,并根据处理后的患者的生理参数数据进行疾病预测,对预测结果进行显示,采用粒子群算法对支持向量机的参数进行优化,提高了支持向量机的预测精度。
3、但是由于疾病样本数据存在多样性,并且随着样本数据的增多,可变性也增多,随着预测结果次数的增加,模型应同时进行优化与升级,从而使预测模型能一直保持预测精度,而申请文件中未对预测模型进行修正,随着使用时间不断变长,预测模型存在预测精度下降的风险。
技术实现思路
1、为了克服现有技术的上述缺陷,本专利技术提供了一种基于算法和大数据的疾病预测系统,以解决上述
技术介绍
中存在的问题。
2、本专利技术提供如下技术方案:一种基于算法和大数据的疾病预测系统,包括样本数据采集模块、目标数据采集模块、数据预处理模块、样本特征提取模块、样本数据存储模块
3、所述样本数据采集模块用于对样本数据进行采集,而后传输至数据预处理模块,所述样本数据为需要预测的疾病的医疗数据;
4、所述目标数据采集模块用于对目标对象的目标数据进行采集,而后传输至数据预处理模块,所述目标对象为进行疾病预测的患者;
5、所述数据预处理模块用于对样本数据采集模块与目标数据采集模块的数据进行预处理,所述数据预处理模块包括:
6、样本数据预处理单元:用于接收样本数据采集模块的数据,对样本数据进行预处理,得到可以直接使用的样本数据后传输至样本特征提取模块;
7、目标数据预处理单元:用于接收目标数据采集模块的数据,对目标数据进行预处理,得到可以直接使用的目标数据后传输至特征匹配模块;
8、所述样本特征提取模块用于接收样本数据预处理单元可直接使用的样本数据,通过特征提取算法对样本数据进行特征提取,并将提取的样本特征数据传输至样本数据存储模块;
9、所述样本数据存储模块用于接收样本特征提取模块的样本特征数据,对样本特征数据进行存储并构建样本特征数据库;
10、所述特征匹配模块用于接收目标数据预处理单元可直接使用的目标数据,通过特征提取算法对目标数据进行特征提取,并与样本特征数据库中的样本特征数据进行特征匹配,并将数据传输至疾病预测模块;
11、所述疾病预测模块用于接收特征匹配模块的数据,对疾病情况进行预测,并将预测结果传输至修正优化模块与人机交互模块;
12、所述修正优化模块用于接收疾病预测模块的预测数据,对预测数据进行修正与优化,得到矫正系数并传输至特征匹配模块,对下一次特征匹配进行矫正;
13、所述人机交互模块用于接收疾病预测模块的数据并进行人机交互。
14、优选的,所述医疗数据包括患病人员的病状体征、患病人员年龄以及性别,所述医疗数据可以来自电子病历、医疗保险索赔记录以及生物传感器,所述目标数据包括目标对象的年龄、性别、病状体征以及过往病史。
15、优选的,所述通过特征提取算法对样本数据进行特征提取包括以下步骤:
16、步骤s01:对样本数据进行序号标记,将样本数据依次标记为1、2、3…i…n,将样本数据中患病人员的病状体征依次标记为1、2、3…j…m;
17、步骤s02:将样本数据中患病人员的病状体征数据采用矩阵形式进行表示:其中,b为患病人员的病状体征矩阵,bij为第i个样本中第j个病状体征的数据,其中,i=1、2、3……n,j=1、2、3……m,n为样本数据总数,m为病状体征总数;
18、步骤s03:计算病状体征数据的类别中心:vi=[vi1,vi2…vij…vim],其中,其中,bi为矩阵b中第i行的行向量,ci为第i个样本的类别,vij为第i个样本中第j个病状特征的样本类别中心,vi为类别ci的样本类别中心;
19、步骤s04:统计样本数据中的患者性别特点与年龄特点:计算性别为女性的比率w与性别为男性的比率m,其中,w1为样本数据中性别为女性的样本数据,w2为样本数据中性别为男性的样本数量。
20、优选的,所述特征匹配模块进行特征匹配包括以下步骤:
21、步骤s11:对目标数据中目标对象的病状体征数据采用矩阵形式进行表示:a=[a1,a2…ah…ah],其中,a为目标对象的病状体征矩阵,ah为第h个病状体征的数据;
22、步骤s12:计算目标数据中病状体征数据的类别中心:其中,va为目标数据病状体征数据的类别中心,ah为第h个病状体征的类别;
23、步骤s13:计算目标数据中病状体征数据的类别中心与样本数据中患病人员病状体征数据的类别中心之间的核距离:其中,φ(va,vi)为目标数据中病状体征数据的类别中心与样本数据中患病人员病状体征数据的类别中心之间的核距离,φ(va)为目标数据病状体征数据的类别核函数,φ(vi)为第i个样本数据中患病人员病状体征数据的类别核函数,η为迭代参数,ki为第i个样本数据的权重系数,
24、优选的,所述矫正系数的计算包括以下步骤:
25、步骤s21:计算预测数据精确率:其中,j1为预测数据精确率,sy为预测数据中预测结果正确的目标对象数量,sz为预测的目标对象总数量;
26、步骤s22:计算预测数据误报率:其中,j2为预测数据误报率,sf为预测数据中预测结果不正确的目标对象数量,yf为样本数据中不属于预测疾病病状体征的数据数量;
27、步骤s23:计算预测数据漏报率:其中,j3为预测数据漏报率,yl为属于预测疾病病状体征但不在样本数据的病状体征中的数据数量;
28、步骤s24:计算矫正系数:其中,ζ为矫正系数,λ1与λ2均为矫正指数正常数,其中,λ1≠λ2。
29、优选的,所述疾病预测模块对疾病情况进行预测的方式为:若核距离0≤φ(va,vi)≤δ,则预测结果为患病,若δ<φ(va,vi)≤ω,则预测结果为患病,若φ(va,vi)>ω,则预测结果为未患病,所述δ为第一界限值,ω为第二界限值,δ<ω。
30、本专利技术的技术效果和优点:
31、(1)本专利技术通过设有修正优化模块,有利于对预测数据进行修正与优化,得到矫正系数并传输至特征匹配模块,对下一次特征匹配进行矫正,通过计算出预测数据精确率、预测数本文档来自技高网...
【技术保护点】
1.一种基于算法和大数据的疾病预测系统,其特征在于:包括样本数据采集模块、目标数据采集模块、数据预处理模块、样本特征提取模块、样本数据存储模块、特征匹配模块、疾病预测模块、修正优化模块、人机交互模块;
2.根据权利要求1所述的一种基于算法和大数据的疾病预测系统,其特征在于:所述医疗数据包括患病人员的病状体征、患病人员年龄以及性别,所述医疗数据可以来自电子病历、医疗保险索赔记录以及生物传感器,所述目标数据包括目标对象的年龄、性别、病状体征以及过往病史。
3.根据权利要求1所述的一种基于算法和大数据的疾病预测系统,其特征在于:所述通过特征提取算法对样本数据进行特征提取包括以下步骤:
4.根据权利要求1所述的一种基于算法和大数据的疾病预测系统,其特征在于:所述特征匹配模块进行特征匹配包括以下步骤:
5.根据权利要求1所述的一种基于算法和大数据的疾病预测系统,其特征在于:所述矫正系数的计算包括以下步骤:
6.根据权利要求1所述的一种基于算法和大数据的疾病预测系统,其特征在于:所述疾病预测模块对疾病情况进行预测的方式为:若核距离0
...【技术特征摘要】
1.一种基于算法和大数据的疾病预测系统,其特征在于:包括样本数据采集模块、目标数据采集模块、数据预处理模块、样本特征提取模块、样本数据存储模块、特征匹配模块、疾病预测模块、修正优化模块、人机交互模块;
2.根据权利要求1所述的一种基于算法和大数据的疾病预测系统,其特征在于:所述医疗数据包括患病人员的病状体征、患病人员年龄以及性别,所述医疗数据可以来自电子病历、医疗保险索赔记录以及生物传感器,所述目标数据包括目标对象的年龄、性别、病状体征以及过往病史。
3.根据权利要求1所述的一种基于算法和大数据的疾病预测系统,其特征在于:所述通过特征提取算法对样本数据进行...
【专利技术属性】
技术研发人员:杨道平,唐晔,王谦,欧阳艾嘉,
申请(专利权)人:遵义师范学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。