The invention discloses a health risk prediction method based on chart model, which includes the following steps: S1, setting the input form of n-bit participants'health examination records; S2, constructing HER-based heterogenous graphs through health examination records; S3, obtaining weight matrix from heterogenous graphs through SHG Health algorithm, and predicting disease risk through weight matrix. The invention uses semi-supervised learning (SSL) algorithm to predict disease risk, and explores a HER-based heterogeneous graph, using most unlabeled data to classify the progressive development in heterogeneous graphs. By inquiring the records of participants'pi, SHG Health can predict whether participants' PI belongs to high-risk disease category or \unknown\ category. It has significant predictive effect on health examination data set and synthetic data set. Compared with other prediction models, it has higher predictive accuracy and has made a great contribution to the field of disease risk prediction.
【技术实现步骤摘要】
一种基于图表模型的健康风险预测方法
本专利技术涉及预测模型领域,尤其涉及一种基于图表模型的健康风险预测方法。
技术介绍
半监督学习(SSL)在基于电子健康记录(EHRs)的医疗保健应用中引起了越来越多的关注。例如,专利网中的一种基于图形的SSL方法,该方法能够了解患者风险组,进行患者风险分层;一种基于图形的SSL联合训练方法,用于乳腺癌生存率预测。当学习者达成共识时,它迭代地将伪标签分配给无标签数据,并在有标签的集合中包含有伪标签实例,直到无标签集合停止减少;一种基于排序的肺结节图像分类的二部分图、一种基于事件序列构建了时间表型的时间图等;但是,这些方法中没有一个考虑“未知”类,并且它们都有针对所有类的预定义实例,无论是由专家还是通过其他机制实现的。一般健康检查在许多国家是医疗保健的一个组成部分,识别有风险的参与者对早期预警和预防干预是很重要的。尽管电子健康记录已经吸引了越来越多的研究关注在近年来数据挖掘和机器学习社区,挖掘一般健康检查数据是一个尚未充分探讨过了,除了少数研究风险预测等慢性疾病预警系统的提出和以前工作中对健康分数分类框架。然而,这些都没有考虑到未标记的数据。学习风险预测分类模型的基本挑战在于,未标记数据构成了所收集数据的大部分。特别的,未标记的数据描述了健康检查参与者,他们的健康状况可能从健康到重病有很大的不同,区分他们的健康状况没有标准的答案。
技术实现思路
本专利技术目的是针对上述问题,提供一种基于图表模型的健康风险预测方法。为了实现上述目的,本专利技术的技术方案是:本专利技术通过挖掘健康检查记录(HERs)的方法,构建了一种基于图表的半监 ...
【技术保护点】
1.一种基于图表模型的健康风险预测方法,其特征在于:包括以下步骤:S1、设置n位参与者的健康检查记录的输入形式;S2、通过健康检查记录构建基于HER的异类图;S3、通过SHG‑Health算法从异类图中获得权重矩阵,并通过权重矩阵对疾病风险进行预测。
【技术特征摘要】
1.一种基于图表模型的健康风险预测方法,其特征在于:包括以下步骤:S1、设置n位参与者的健康检查记录的输入形式;S2、通过健康检查记录构建基于HER的异类图;S3、通过SHG-Health算法从异类图中获得权重矩阵,并通过权重矩阵对疾病风险进行预测。2.如权利要求1所述的基于图表模型的健康风险预测方法,其特征在于:所述步骤S1中设置n位参与者的健康检查记录的输入形式包括以下步骤:S11、设是参与者i的ni个健康检查记录的集合,ri是(xij,tij)的一个元素,是在时间tij的一个d维向量,S={s1,...,Sl,Sl+1,...,sn}是n位参与者的健康检查记录集合,C={1,...,c}为标记集合,前l个参与者si(i≤l)被标记为yi∈C,其余u=n一l(l<<u)位参与者sl+1,...,sl+u将不被标记;S12、设则表示i类型节点的标签,设为向量yip的第k个元素;当xip被标记时,xip属于k类时xip不属于k类时当xip没有被标记时,S13、设为m节点类型的计算软标签,表示确定性程度的向量。3.如权利要求2所述...
【专利技术属性】
技术研发人员:莫毓昌,李灿东,林栋,黄华林,连志杰,
申请(专利权)人:华侨大学,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。