数据处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:33533430 阅读:64 留言:0更新日期:2022-05-19 02:09
本公开涉及一种数据处理方法、装置、存储介质及电子设备。所述方法包括:获取待处理的检查数据,检查数据包括目标用户在一次体检中检查的至少一个检查指标及检查指标各自对应的指标值;根据与目标生理状态相关联的至少一个目标检查指标,从检查数据中筛选出与目标检查指标对应的目标指标值;根据目标指标值和预训练的分类模型,确定针对检查数据的分类结果,作为目标分类结果,目标分类结果用于表征目标用户在未来处于目标生理状态的风险程度,其中,分类模型包括依次相连的多个决策树模块,每一决策树模块包含至少一个决策树,且在分类模型由输入至输出的方向上,每一决策树模块所包含的决策树数量依次减少。块所包含的决策树数量依次减少。块所包含的决策树数量依次减少。

【技术实现步骤摘要】
数据处理方法、装置、存储介质及电子设备


[0001]本公开涉及计算机
,具体地,涉及一种数据处理方法、装置、存储介质及电子设备。

技术介绍

[0002]人的生理状态可以反映人的身体状况,进而反映其健康情况。通常情况下,通过人的生理状态,能够确定其当前的身体状况,同时,也能在一定程度上预测其之后的身体状况。因此,可以基于体检者的体检数据,对体检者在未来处于某种非健康生理状态的风险程度进行预测,以确定该体检者未来的健康走势,从而,对于有极高风险转为非健康生理状态的体检者,能够及早地发现并针对性地采取预防措施,以避免该体检者转变为非健康生理状态。
[0003]相关技术中,对于上述风险程度的预测,通常由医护人员根据自身的医学知识和过往经验进行人工预测,存在主观差异性大、误诊漏诊率高、预测效率低等问题。

技术实现思路

[0004]本公开的目的是提供一种数据处理方法、装置、存储介质及电子设备,通过对用户的检查数据进行分类,准确地预测用户在未来处于非健康生理状态的风险程度,便于及早对高风险用户采取干预措施,防止用户转为非健康生理本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待处理的检查数据,所述检查数据包括目标用户在一次体检中检查的至少一个检查指标及所述检查指标各自对应的指标值;根据与目标生理状态相关联的至少一个目标检查指标,从所述检查数据中筛选出与所述目标检查指标对应的目标指标值;根据所述目标指标值和预训练的分类模型,确定针对所述检查数据的分类结果,作为目标分类结果,所述目标分类结果用于表征所述目标用户在未来处于所述目标生理状态的风险程度,其中,所述分类模型包括依次相连的多个决策树模块,每一决策树模块包含至少一个决策树,且在所述分类模型由输入至输出的方向上,每一决策树模块所包含的决策树数量依次减少。2.根据权利要求1所述的方法,其特征在于,所述与目标生理状态相关联的目标检查指标通过如下方式确定:获取多个历史数据样本及每一历史数据样本对应的分类标签,其中,每一所述历史数据样本包括指定类型用户对应于多个历史检查指标的历史指标值,所述指定类型用户为出现过目标生理特征的用户,所述目标生理特征为用户的生理状态变化至所述目标生理状态之前所具有的生理特征,所述分类标签用于表征所述历史数据样本所关联的用户在出现所述目标生理特征后处于所述目标生理状态的风险程度;对所述历史数据样本进行标准化处理,得到各历史指标值对应的历史特征值,以使对应于同一历史检查指标的多个历史特征值均值为0且方差为1;根据每一所述历史数据样本的历史特征值和分类标签,确定多元线性回归模型,其中,在所述多元线性回归模型中,所述历史数据样本的每种历史检查指标对应有一权重系数;确定所述多元线性回归模型的损失函数,其中,所述损失函数为均方误差与正则项之和,所述正则项具有正则化系数;通过调整所述正则化系数,改变所述历史检查指标对应的权重系数,并根据所述历史检查指标对应的权重系数的变化情况,确定所述目标检查指标。3.根据权利要求2中所述的方法,其特征在于,所述通过调整所述正则化系数,改变所述历史检查指标对应的权重系数,并根据所述历史检查指标对应的权重系数的变化情况,确定所述目标检查指标,包括:在每次训练过程中,增大所述正则化系数的值,以使至少一个权重系数变为0,并确定权重系数仍不为0的历史检查指标的第一数量;当所述第一数量小于预设的第二数量时,停止训练,并将停止训练时权重系数不为0的历史检查指标确定为所述目标检查指标。4.根据权利要求2所述的方法,其特征在于,按照如下公式确定所述损失函数中的均方误差MSE:其中,m为所述历史数据样本的数量,θ为由所述权重系数构成的权重系数向量,θ
T
为所述权重系数向量的转置,X
(k)
为第k个历史数据样本的历史特征值,y
(k)
为第k个历史数据样
本的分类标签;并且,所述损失函数中的正则项包括第一正则项和/或第二正则项;若所述损失函数中包括第一正则项,则按照如下公式,确定第一正则项R1:若所述损失函数中包括第二正则项,则按照如下公式,确定第二正则项R2:其中,α为所述正则化系数,θ
i
为第i个历史检查指标...

【专利技术属性】
技术研发人员:何涛王晨宋庆荔李志刘建生闻英友
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1