一种脑出血分类预测装置制造方法及图纸

技术编号:33282557 阅读:52 留言:0更新日期:2022-04-30 23:43
本发明专利技术涉及一种脑出血分类预测装置,包括:数据采集模块,用于采集患者的就诊信息;分类预测模块,用于将患者的就诊信息作为分类预测模型的输入,得到患者未来脑出血的可能;其中,分类预测模型由模型构建模块构建,模型构建模块包括:收集单元,用于收集患者的纵向面板数据;预处理单元,用于对纵向面板数据进行独立性检验和统计量检验;分类单元,用于将预处理后的纵向面板数据输入至多个已经训练好的分类模型中,得到分类结果;选择单元,从分类结果中选出分类效果最佳的分类模型;调整单元,用于对选择单元选出的分类模型进行调整使得分类模型在准确性、精准度、召回率达到平衡,并将调整后的分类模型作为分类预测模型。并将调整后的分类模型作为分类预测模型。并将调整后的分类模型作为分类预测模型。

【技术实现步骤摘要】
一种脑出血分类预测装置


[0001]本专利技术涉及计算机辅助医疗数据分析
,特别是涉及一种脑出血分类预测装置。

技术介绍

[0002]脑出血是危害人类健康的主要疾病之一,目前在对脑出血的预测研究中,对脑出血后脑血肿的预测和脑出血预后的研究比较多,但是对非脑出血病人脑出血的预测研究比较少。现有技术中,对非脑出血者的脑出血概率预测,通常通过外部因素如外界温度、气压等因素建立脑出血预测模型,进而对群体脑出血概率进行分析预测。但是该方法预测的对象多是群体,不能有效得出某一病人脑出血的概率,同时这种预测方法没有应用到能够直接对脑出血预测的特征而是预测特征是多变的天气和气压来建立预测模型,这也影响预测的准确性。

技术实现思路

[0003]本专利技术所要解决的技术问题是提供一种脑出血分类预测装置,能够得到某一病人脑出血的可能性,并且能在准确性、精准度、召回率上达到平衡。
[0004]本专利技术解决其技术问题所采用的技术方案是:提供一种脑出血分类预测装置,包括:
[0005]数据采集模块,用于采集患者的就诊信息;
[0006]分类预测模块,用于将所述患者的就诊信息作为分类预测模型的输入,得到患者未来脑出血的可能;
[0007]其中,所述分类预测模型由模型构建模块构建,所述模型构建模块包括:
[0008]收集单元,用于收集患者的纵向面板数据;
[0009]预处理单元,用于对所述纵向面板数据进行独立性检验和统计量检验;
[0010]分类单元,用于将所述预处理后的纵向面板数据输入至多个已经训练好的分类模型中,得到分类结果;
[0011]选择单元,从所述分类结果中选出分类效果最佳的分类模型;
[0012]调整单元,用于对选择单元选出的分类模型进行调整使得所述分类模型在准确性、精准度、召回率达到平衡,并将调整后的分类模型作为所述分类预测模型。
[0013]所述纵向面板数据为M年内N个患者的就诊信息,其中,每年N个患者的就诊信息作为截面数据。
[0014]所述预处理单元在进行独立性检测时采用卡方检验对所述纵向面板数据之间的关联性进行检验,当存在关联性时,重新对所述纵向面板数据进行筛选。
[0015]所述预处理单元在进行统计量检验时采用进行检验所述纵
向面板数据是否有聚类特征,当无聚类特征时,重新对所述纵向面板数据进行筛选,其中,x
i
为从所述纵向面板数据中随机找出的第i个点与该第i个点在所述纵向面板数据中最近点的距离;y
i
为从所述纵向面板数据的范围内随机生成的第j个点与该第j个点在所述纵向面板数据中最近点的距离,n表示找出点和随机生成点的个数。
[0016]所述预处理单元还用于判断所述纵向面板数据中的空值情况,当所述纵向面板数据中的空值超过预设值时,则在所述空值为数值变化量时,采用所有数值变化量的平均数取代所述空值,在所述空值为分类变化量时,去除该空值。
[0017]所述多个已经训练好的分类模型为knn模型、逻辑回归模型或决策树模型。
[0018]所述选择单元根据AUC曲线选出分类效果最佳的分类模型。
[0019]所述调整单元根据ROC曲线选取最佳切线点,使得所述选出的分类模型的准确性、精准度和召回率达到平衡。
[0020]有益效果
[0021]由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果:本专利技术在模型训练时通过对数据变量进行有效处理,确保了分类预测模型在准确性、精准度、召回率上达到平衡,并且本专利技术采用患者的历史就诊信息作为输入,因此可以得到某一患者在未来患有脑出血的概率,实现了对单体对象的预测。
附图说明
[0022]图1是本专利技术实施方式中模型构建模块构建分类预测模型的流程图。
具体实施方式
[0023]下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
[0024]本专利技术的实施方式涉及一种脑出血分类预测装置,包括:数据采集模块,用于采集患者的就诊信息;分类预测模块,用于将所述患者的就诊信息作为分类预测模型的输入,得到患者未来脑出血的可能。其中,就诊信息包括患者的医疗保险类型、年龄、性别、年均医疗开销、目前已有疾病和家族史等信息。
[0025]本实施方式中分类预测模型由模型构建模块构建,所述模型构建模块在构建分类预测模型时,如图1所示,包括以下步骤:
[0026]首先,选取变量,即通过收集单元收集患者的纵向面板数据,所述纵向面板数据为M年内N个患者的就诊信息,其中,每年N个患者的就诊信息作为截面数据。
[0027]接着通过预处理单元对所述纵向面板数据进行预处理,其中预处理包括:空值检测、独立性检验和统计量检验。
[0028]在空值检测时,判断所述纵向面板数据中的空值情况,若所述纵向面板数据中的总空值量在5%以下时,将空值进行归零处理,由于此时的空值数量较少,不会影响模型出现偏差。若所述纵向面板数据中的总空值量大于5%时,则需要对各个空值的类型进行判断,当空值的类型为数值变化量时,通过求取所有数值变化量的平均值来填充该空值,当空
值的类型为分类变化量时,则去除该空值。由于删除包含缺失值的数据可能会导致模型出现偏差,因此本实施方式对其进行求取平均值处理,而对于分类变化量由于不能求取平均值,若采用随机分类会影响模型的结果,因此本实施方式采用去除的方式进行处理。
[0029]在独立性检验时,本实施方式采用卡方检验对所述纵向面板数据进行变量之间独立性检验。若所述纵向面板数据中变量间的关联性较大,则会导致模型过拟合的情况发生,因此在存在关联性时,重新对所述纵向面板数据进行筛选。
[0030]在统计量检验时,本实施方式采用进行检验所述纵向面板数据是否有聚类特征,当无聚类特征时,重新对所述纵向面板数据进行筛选。通过统计量检验,以防止数据集本身分布太过均匀,因没有相关聚类特征而影响模型输出结果。若统计量H接近于1,则表示所述纵向面板数据有明显的聚类特征,可以进行下一步。若统计量H接近0.5,则说明所述纵向面板数据基本为随机分布,无明显聚类特征,需要重新筛选纵向面板数据。其中,x
i
是指从所述纵向面板数据随机找n个点,记为p1,p2,...,p
n
,对其中的每一个点p
i
,都在所述纵向面板数据中找到一个离它最近的点,并计算它们之间的距离x
i
,从而得到距离向量x1,x2,

,x
n
;y
j
是指在所述纵向面板数据的可能取值范围内随机生成n个点,记为q1,q2,

,q
n
,对每个随机生成的点q
j
,都在所述纵向面板本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种脑出血分类预测装置,其特征在于,包括:数据采集模块,用于采集患者的就诊信息;分类预测模块,用于将所述患者的就诊信息作为分类预测模型的输入,得到患者未来脑出血的可能;其中,所述分类预测模型由模型构建模块构建,所述模型构建模块包括:收集单元,用于收集患者的纵向面板数据;预处理单元,用于对所述纵向面板数据进行独立性检验和统计量检验;分类单元,用于将所述预处理后的纵向面板数据输入至多个已经训练好的分类模型中,得到分类结果;选择单元,从所述分类结果中选出分类效果最佳的分类模型;调整单元,用于对选择单元选出的分类模型进行调整使得所述分类模型在准确性、精准度、召回率达到平衡,并将调整后的分类模型作为所述分类预测模型。2.根据权利要求1所述的脑出血分类预测装置,其特征在于,所述纵向面板数据为M年内N个患者的就诊信息,其中,每年N个患者的就诊信息作为截面数据。3.根据权利要求1所述的脑出血分类预测装置,其特征在于,所述预处理单元在进行独立性检测时采用卡方检验对所述纵向面板数据之间的关联性进行检验,当存在关联性时,重新对所述纵向面板数据进行筛选。4.根据权利要求1所述的脑出血分类预测装置,其特征在于,所述预处理单元在进行统计量检验...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:上海健交科技服务有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1