多临床分期疾病的辅助分类方法、设备及存储介质技术

技术编号:35151669 阅读:30 留言:0更新日期:2022-10-05 10:30
本发明专利技术提出一种多临床分期疾病的辅助分类方法、设备及存储介质,所述方法包括:确定病历数据集;提取其中的特征值和标签,组成特征值集合和标签集合;使用二分类模型对病历数据集进行二分类;对所述特征值集合进行关联度分析,得到优化后的特征值集合;对优化后的特征值集合进行筛选,得到关键特征值集合;在健康数据集中查找到特征值符合中确诊条件的病历数据,并将其加入到患病数据集中,构成新的患病数据集;对新的患病数据集进行多分类,得到对疾病不同分期的预测。本发明专利技术通过分类算法模型,对疾病分期预测,辅助医生进行疾病诊断。辅助医生进行疾病诊断。辅助医生进行疾病诊断。

【技术实现步骤摘要】
多临床分期疾病的辅助分类方法、设备及存储介质


[0001]本申请涉及智能医疗领域,尤其涉及一种多临床分期疾病的辅助分类方法、设备及存储介质。

技术介绍

[0002]疾病分期最初仅停留在纯临床层面,如,症状轻微vs.严重,此后在尸检、影像学及生物标志物领域进展的指导下逐渐进化为更先进的临床病理学视角。疾病分期适用于那些可能迁延不愈、功能进行性恶化和/或可能早亡的疾病,对大多数疾病来说,早期病情相对稳定,临床治愈率也较高,晚期病情发展快,治愈率较低。如果患者在疾病发展早期能够发现并诊治,在病情恶化前未雨绸缪,将大大提高患者临床治愈率,因此如何准确诊断疾病的分期是临床医学的重要问题之一。伴随机器学习的发展和电子病历的完善,数据驱动的智能医疗诊疗方法成为主流。智能医疗是近几年学术界研究的热点,也是计算机和医疗领域结合的热门关注点,因此如何通过智能医疗帮助疾病分期诊断,是要解决的问题。

技术实现思路

[0003]有鉴于此,本申请提出一种多临床分期疾病的辅助分类方法、设备及存储介质,以解决通过智能医疗帮助疾病分期诊断的问题。
[0004]本申请的技术方案实现方法包括:
[0005]一种多临床分期疾病的辅助分类方法,包括:
[0006]确定病历数据集S1,所述病历数据集S1中包含至少一个患者的病历数据;
[0007]提取病历数据集S1中各病历的特征值和标签,组成特征值集合F和标签集合D,所述特征值集合F包括各患者病历数据中的体查数据及检查结果数据,所述标签集合D包括基于医生诊断结果确定的患病或健康两类标签;
[0008]基于特征值集合F和标签集合D使用二分类模型对病历数据集S1进行二分类,得到健康数据集和患病数据集;
[0009]对所述特征值集合F进行关联度分析,得到优化后的特征值集合F1;
[0010]基于医疗领域信息,对优化后的特征值集合F1进行筛选,得到关键特征值集合F2,及关键特征值集合F2中的特征所对应的条件;
[0011]在健康数据集中查找到特征值符合F2中确诊条件的病历数据,并将其加入到患病数据集中,构成新的患病数据集S3;
[0012]对新的患病数据集S3进行多分类,得到对疾病不同分期的预测。
[0013]所述的方法中,所述体查数据至少包括:身高、体重、疼痛程度、吸烟史、饮酒史、病史;
[0014]所述检查结果数据至少包括:血尿生化检测结果、影像学检查结果。
[0015]所述的方法中,所述基于特征值集合F和标签集合D使用二分类模型对病历数据集S1进行二分类,包括:
[0016]建立候选二分类模型库,所述候选二分类模型库中包括多个二分类模型;
[0017]同时执行多个二分类模型,得到多个二分类模型的准确率、召回率、F1Score值,综合考虑以上三种分类评价指标,选择评价指标效果最好的,一个二分类模型对病历数据集S1进行二分类。
[0018]所述的方法中,所述对所述特征值集合F进行关联度分析,得到优化后的特征值集合F1,包括:
[0019]通过卡方检验,或样本方差值,或离散类别交互信息,对所述特征值集合F中的特征值进行关联度分析,并删除关联度较低的特征值,得到优化后的特征值集合F1。
[0020]所述的方法中,所述基于医疗领域信息,对优化后的特征值集合F1进行筛选,得到关键特征值集合F2,其中关键特征值集合为对确诊疾病有决定性影响的特征值集合。
[0021]所述的方法中,所述对新的患病数据集S3进行多分类之前,还包括:
[0022]对新的患病数据集S3中缺失的特征项,根据对应的医疗含义以特定值,或平均值,或众数进行缺失值填充;
[0023]对填充后的患病数据集S3中的数据进行标准化,构成数据集S4。
[0024]所述的方法中,所述对新的患病数据集S3进行多分类,具体为:
[0025]根据疾病种类,确定新的标签集合D

,所述新的标签集合D

为所述疾病对应的分期诊断集合;
[0026]基于深度神经网络模型,对S4进行多分类;其中,
[0027]输入层的神经元个数对应特征集合F1中的特征值个数;
[0028]输出层的神经元个数对应疾病分期个数,即标签集合D

中数值个数;
[0029]使用relu函数作为各隐藏层的激活函数,并创建softmax函数,确定疾病分期预测。
[0030]本专利技术还提出一种多临床分期疾病的辅助分类设备,包括:处理器及存储器;
[0031]所述处理器用于存储计算机程序,用于实现所述的多临床分期疾病的辅助分类方法。
[0032]本专利技术还提出一种存储介质,用于至少存储一组指令集;
[0033]所述指令集用于被调用并至少执行所述的多临床分期疾病的辅助分类方法。
[0034]本专利技术的优势在于,本专利技术所提出的方法,适用于多分期的疾病诊断。首先使用机器学习二分类模型对是否确诊疾病进行二分类,再应用医疗领域专业知识确定特征值集合,将二分类的结果中确诊数据采用深度学习多分类模型实现疾病分期诊断。
附图说明
[0035]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0036]图1为本专利技术一种多临床分期疾病的辅助分类方法实施例流程图;
[0037]图2为本专利技术一种多临床分期疾病的辅助分类设备结构示意图。
具体实施方式
[0038]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0039]有鉴于此,本申请提出一种多临床分期疾病的辅助分类方法、设备及存储介质,以解决通过智能医疗帮助疾病分期诊断的问题。
[0040]伴随机器学习的发展和电子病历的完善,数据驱动的智能医疗诊疗方法成为主流。大量电子病历的产生为智能医疗提供了充足的数据源。另一方面,如何准确的进行疾病分期一直是临床医生进行疾病诊断的重难点之一,对大多数疾病来说,早期病情相对稳定,临床治愈率也较高,晚期病情发展快,治愈率较低。能够及时准确的进行疾病分期将大大提高患者的生存率和愈后质量。鉴于此现实问题,本专利技术提出了一种多临床分期疾病的辅助分类方法,该方法适用于具有多临床分期的疾病的预测,辅助临床医生进行疾病诊断。
[0041]本申请的技术方案实现方法包括:
[0042]本专利技术实施例给出一种多临床分期疾病的辅助分类方法,如图1所示,包括:
[0043]S101:确定病历数据集S1,所述病历数据集S1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多临床分期疾病的辅助分类方法,其特征在于,包括:确定病历数据集S1,所述病历数据集S1中包含至少一个患者的病历数据;提取病历数据集S1中各病历的特征值和标签,组成特征值集合F和标签集合D,所述特征值集合F包括各患者病历数据中的体查数据及检查结果数据,所述标签集合D包括基于医生诊断结果确定的患病或健康两类标签;基于特征值集合F和标签集合D使用二分类模型对病历数据集S1进行二分类,得到健康数据集和患病数据集;对所述特征值集合F进行关联度分析,得到优化后的特征值集合F1;基于医疗领域信息,对优化后的特征值集合F1进行筛选,得到关键特征值集合F2,及关键特征值集合F2中的特征所对应的条件;在健康数据集中查找到特征值符合F2中确诊条件的病历数据,并将其加入到患病数据集中,构成新的患病数据集S3;对新的患病数据集S3进行多分类,得到对疾病不同分期的预测。2.根据权利要求1所述的方法,其特征在于,所述体查数据至少包括:身高、体重、疼痛程度、吸烟史、饮酒史、病史;所述检查结果数据至少包括:血尿生化检测结果、影像学检查结果。3.根据权利要求1所述的方法,其特征在于,所述基于特征值集合F和标签集合D使用二分类模型对病历数据集S1进行二分类,包括:建立候选二分类模型库,所述候选二分类模型库中包括多个二分类模型;同时执行多个二分类模型,得到多个二分类模型的准确率、召回率、F1Score值,综合考虑以上三种分类评价指标,选择评价指标效果最好的,一个二分类模型对病历数据集S1进行二分类。4.根据权利要求1所述的方法,其特征在于,所述对所述特征值集合F进行关联度分析,得到优化后的特征值集合F1,包括:通过卡方检验,或样本方差值,或...

【专利技术属性】
技术研发人员:张宏国任涵彬杜宇芳方舟白瑞杨霄璇宋雪李锐刘明鸽齐红何晨龙耿瑞
申请(专利权)人:黑龙江省网络空间研究中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1