System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于神经网络的胃癌患病风险评估方法和装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于神经网络的胃癌患病风险评估方法和装置制造方法及图纸

技术编号:41331839 阅读:5 留言:0更新日期:2024-05-20 09:52
本发明专利技术公开了一种基于神经网络的胃癌患病风险评估方法和装置,包括:获取病例人群的胃癌患病风险因素数据并进行预处理;获取病例人群的临床检测数据和生化数据,并按照OLGA/OLGIM评判原则将病例人群划分为低危胃癌组,中危胃癌组,高危及患病胃癌组这三组胃癌风险等级,作为标注数据;基于采样后的数据采用神经网络DANets学习各组胃癌患病风险因素数据与胃癌风险等级之间的关系,得到最佳评估模型;利用最佳评估模型对验证集进行验证得到分类验证效果,利用SHAP算法得到神经网络的可视化信息,实现对各风险因素的重要性进行分析,这样能够实现廉价、无创、快速、高精度的胃癌患病风险评估。

【技术实现步骤摘要】

本专利技术属于医疗数据处理技术以及计算机机器学习领域,具体地说,是一种基于神经网络的胃癌患病风险评估方法和装置


技术介绍

1、胃癌是一种严重的消化道恶性肿瘤,其发病率和死亡率在全球范围内都较高。胃癌的早期症状往往不明显,容易被忽视,导致错过最佳治疗时机。目前内镜检查和病理检查是胃癌诊断的金标准。

2、传统的胃癌诊断方法(内镜、手术、病理组织提取)有以下问题:这些方法属于侵入性的检查方法,可能会引起一些并发症,如出血、感染、穿孔等,尤其是对于一些患有严重疾病的患者来说,可能会增加治疗风险。这些方法的使用成本通常较高,可能会增加患者的经济负担,且不宜普及使用。这些方法通常耗时较多,可能会延误患者的最佳治疗时间。因此,需要一种更加准确、便捷的诊断方法来预测胃癌发病风险,为胃癌的预防和治疗提供有力支持。

3、随着大数据和计算能力的提高,深度学习成为研究的热点。深度学习模型具有更多的隐藏层和更复杂的网络结构,可以处理更复杂的任务。在医学领域,深度学习模型已经广泛应用于医学图像处理、疾病诊断和药物研发等方面。在医学诊断方面,深度学习模型的应用已经取得了显著的成果。例如,在肺癌诊断中,深度学习神经网络模型,如卷积神经网络等,可以通过分析ct图像中的特征,准确识别出肺癌病灶,并且比传统方法更加准确和高效。

4、数据的质量和合理性对于神经网络预测的性能和结果存在很大的影响。已有相关流行病学文章利用传统医学统计学方法对胃癌风险因素进行分析,其中年龄、吸烟情况、幽门螺杆菌感染和胃蛋白酶含量是主要胃癌风险因素。其中幽门螺杆菌感染是胃相关疾病发生的主要原因,被认为是胃癌的主要危险因素。获得这些数据的过程无创、简单、可以在现实中实现,可作为胃癌诊断的可靠临床诊断依据。

5、神经网络可以分为两个主要方面,其一是分析文本方向,包括mlp、bp、rnn、lstm等模型;其二是处理图像方向,包括cnn、gan等模型。然而,与计算机视觉和自然语言处理领域深度学习的蓬勃发展不同,很少有神经网络针对表格数据进行了充分设计,而大部分的医学数据却都是以表格数据呈现。danets是最新的针对表格数据进行处理的神经网络设计之一,其可以学习显式分组相关的输入特征并生成更高级别的特征以进行语义抽象,从而探究表格数据中不同特征的深层关系,并达到卓越的性能。


技术实现思路

1、基于上述,本专利技术的目的是提供一种基于神经网络的胃癌患病风险评估方法和装置,通过神经网络来防止胃癌患病诊断的侵入性伤害,且降低医疗成本。

2、为实现上述专利技术目的,本专利技术实施例提供的一种基于神经网络的胃癌患病风险评估方法,包括以下步骤:

3、获取病例人群的胃癌患病风险因素数据并进行预处理;

4、获取病例人群的临床检测数据和生化数据,并基于临床检测数据和生化数据按照olga/olgim评判原则将病例人群划分为低危胃癌组,中危胃癌组,高危及患病胃癌组这三组胃癌风险等级,作为标注数据;

5、按照标签数据将预处理后的胃癌患病风险因素数据划分为训练集和验证集;

6、采用adasyn过采样处理方式对训练集进行采样,基于采样后的数据采用神经网络danets学习各组胃癌患病风险因素数据与胃癌风险等级之间的关系,通过抽象层abstlay的设计学习显示分组相关的输入特征并生成更高级别的特征来进行分类训练,得到最佳评估模型;

7、利用最佳评估模型对验证集进行验证得到分类验证效果,利用shap算法得到神经网络的可视化信息,实现对各风险因素的重要性进行分析。

8、优选地,所述胃癌患病风险因素数据包括18项,分别为地区、年龄、性别、民族、疾病史、家族史、胃肠症状、饮食时间、盐摄入情况、糖分摄入情况、油脂摄入情况、是否进食辛辣食物、是否进食烫的食物、水果摄入情况、蔬菜摄入情况、豆制品摄入情况、牛奶摄入情况、以及饮酒情况。

9、优选地,对多项胃癌患病风险因素数据进行预处理,包括:

10、首先,对各项数据进行统计得到统计特征,其中统计特征包括正常值范围、均值、方差、以及最值;

11、然后,对各项数据进行缺失值检测和异常值监测,并将包含缺失值和异常值的病例数据剔除。

12、优选地,所述临床检测数据和生化数据包括血清胃蛋白酶含量检测数据(pg)、幽门螺杆菌感染检查数据(hp)、以及胃镜检查数据。

13、优选地,对神经网络danets进行分类训练时,采用adam方法对神经网络参数进行优化,损失函数采用权重平衡过的交叉熵损失。

14、优选地,在计算的交叉熵损失时,低危胃癌组,中危胃癌组,高危及患病胃癌组的权重分别为1,2,7。

15、优选地,所述方法还包括:将预处理后的胃癌患病风险因素数据划分为训练集和测试集前,随机扰动数据以防相同数据的堆叠,划分时使得训练集和测试集中均包含低危胃癌组,中危胃癌组,高危及患病胃癌组。

16、优选地,所述方法还包括:对神经网络danets进行分类训练时,若连续10次验证集度量保持不变,则提前结束训练,防止模型过拟合。

17、为实现上述专利技术目的,本专利技术实施例还提供了一种基于机器学习的胃癌患病风险评估装置,包括:

18、风险因素数据模块,用于获取病例人群的胃癌患病风险因素数据并进行预处理;

19、标注数据模块,用于获取病例人群的临床检测数据和生化数据,并基于临床检测数据和生化数据按照olga/olgim评判原则将病例人群划分为低危胃癌组,中危胃癌组,高危及患病胃癌组这三组胃癌风险等级,作为标注数据;

20、划分模块,用于按照标签数据将预处理后的胃癌患病风险因素数据划分为训练集和验证集;

21、训练模块,用于采用adasyn过采样处理方式对训练集进行采样,基于采样后的数据采用神经网络danets学习各组胃癌患病风险因素数据与胃癌风险等级之间的关系,通过抽象层abstlay的设计学习显示分组相关的输入特征并生成更高级别的特征来进行分类训练,得到最佳评估模型;

22、验证模块,用于利用最佳评估模型对验证集进行验证得到分类验证效果,利用shap算法得到神经网络的可视化信息,实现对各风险因素的重要性进行分析。

23、为实现上述专利技术目的,本专利技术实施例还提供了一种计算设备,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现上述基于神经网络的胃癌患病风险评估方法的步骤。

24、与现有技术相比,本专利技术具有以下有益效果:

25、1)利用适合于表格数据的神经网络danets用于胃癌患病风险评估,能够快速准确的生成判断,辅助医生进行诊断。

26、2)调整神经网络损失函数,提升胃癌患病风险高的病例的权重,提升预测精度的同时确保患病风险高的病例不被漏诊。

27、3)某种程度上,能有效更早更方便地筛查出危险等级高的病人,为病人的早本文档来自技高网...

【技术保护点】

1.一种基于神经网络的胃癌患病风险评估方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,所述胃癌患病风险因素数据包括18项,分别为地区、年龄、性别、民族、疾病史、家族史、胃肠症状、饮食时间、盐摄入情况、糖分摄入情况、油脂摄入情况、是否进食辛辣食物、是否进食烫的食物、水果摄入情况、蔬菜摄入情况、豆制品摄入情况、牛奶摄入情况、以及饮酒情况。

3.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,对多项胃癌患病风险因素数据进行预处理,包括:

4.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,所述临床检测数据和生化数据包括血清胃蛋白酶含量检测数据(PG)、幽门螺杆菌感染检查数据(HP)、以及胃镜检查数据。

5.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,对神经网络DANets进行分类训练时,采用Adam方法对神经网络参数进行优化,损失函数采用权重平衡过的交叉熵损失,且低危胃癌组,中危胃癌组,高危及患病胃癌组的权重满足:低危胃癌组的权重小于中危胃癌组的权重小于高危及患病胃癌组的权重。

6.根据权利要求5所述的基于神经网络的胃癌患病风险评估方法,其特征在于,在计算的交叉熵损失时,低危胃癌组,中危胃癌组,高危及患病胃癌组的权重分别为1,2,7。

7.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,还包括:将预处理后的胃癌患病风险因素数据划分为训练集和测试集前,随机扰动数据以防相同数据的堆叠,划分时使得训练集和测试集中均包含低危胃癌组,中危胃癌组,高危及患病胃癌组。

8.根据权利要求1所述的基于机器学习的胃癌患病风险评估方法,其特征在于,还包括:对神经网络DANets进行分类训练时,若连续10次验证集度量保持不变,则提前结束训练,防止模型过拟合。

9.一种基于机器学习的胃癌患病风险评估装置,其特征在于,包括:

10.一种计算设备,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,其特征在于,所述一个或多个处理器执行所述可执行代码时,用于实现权利要求1-8中任一项所述的基于神经网络的胃癌患病风险评估方法的步骤。

...

【技术特征摘要】

1.一种基于神经网络的胃癌患病风险评估方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,所述胃癌患病风险因素数据包括18项,分别为地区、年龄、性别、民族、疾病史、家族史、胃肠症状、饮食时间、盐摄入情况、糖分摄入情况、油脂摄入情况、是否进食辛辣食物、是否进食烫的食物、水果摄入情况、蔬菜摄入情况、豆制品摄入情况、牛奶摄入情况、以及饮酒情况。

3.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,对多项胃癌患病风险因素数据进行预处理,包括:

4.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,所述临床检测数据和生化数据包括血清胃蛋白酶含量检测数据(pg)、幽门螺杆菌感染检查数据(hp)、以及胃镜检查数据。

5.根据权利要求1所述的基于神经网络的胃癌患病风险评估方法,其特征在于,对神经网络danets进行分类训练时,采用adam方法对神经网络参数进行优化,损失函数采用权重平衡过的交叉熵损失,且低危胃癌组,中危胃癌组,高危及患病胃癌组的权重满足:...

【专利技术属性】
技术研发人员:童钰铃马子涵陈晋泰吴健徐红霞杜邦
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1