System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种IgA肾病早期诊断标志物确定方法及系统技术方案_技高网

一种IgA肾病早期诊断标志物确定方法及系统技术方案

技术编号:40550643 阅读:7 留言:0更新日期:2024-03-05 19:09
本发明专利技术属于人工智能领域,尤其是涉及一种IgA肾病早期诊断标志物确定方法及系统,根据IgA肾病患者样本和非IgA肾病患者样本生成训练集和测试集;采用训练集训练第一XGBoost模型,根据第一XGBoost模型中每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合;采用测试集训练第二XGBoost模型,根据第二XGBoost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二XGBoost模型中每棵决策树的标志物集合得到第二标志物集合;根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到IgA肾病早期诊断标志物。本发明专利技术提高了识别IgA肾病早期诊断标志物准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,尤其是一种iga肾病早期诊断标志物确定方法及系统。


技术介绍

1、肾小球肾炎(iga肾病)是一种慢性肾脏疾病,其特征是肾脏中免疫球蛋白a(iga)的异常沉积,这种沉积会导致肾脏炎症和损伤,最终可能导致肾功能衰竭。iga肾病是一种自身免疫疾病,目前其确切原因尚不完全清楚。肾脏活检是确诊iga肾病的金标准,通过检查肾脏组织样本来确认iga的沉积,但是这是一种有创检测方法,对于有基础病的患者,可能会引发其他问题。无论对于医生还是患者都在尽力想在iga肾病的早期发现,但是没有一项准确的标志物能够确切的确定是iga肾病,或者能准确的预测iga肾病。国内外很多医院和研究机构都在试图寻找iga肾病的标志物,而且随着人工智能技术的发展,越来越多的人工智能方法应用到iga肾病可靠标志物的寻找上来,但是效果还是不太理想。


技术实现思路

1、为了能够准确的识别iga肾病早期的标志物,本专利技术提供了一种iga肾病早期诊断标志物确定方法,所述方法包括以下步骤:

2、访问iga肾病患者早期的电子病历以及非iga肾病患者的早期电子病历,从电子病历中获取预设集合中标志物对应的内容,将所述内容经过编码后,构成iga肾病患者样本和非iga肾病患者样本,并生成训练集和测试集;

3、采用训练集训练第一xgboost模型,利用所述训练集训练第一xgboost模型,根据第一xgboost模型中每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合;采用测试集训练第二xgboost模型,根据第二xgboost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二xgboost模型中每棵决策树的标志物集合得到第二标志物集合;

4、根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到iga肾病早期诊断标志物。

5、优选地,所述根据每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合,具体为:

6、解析第一xgboost模型,记录决策树编号、分裂标志物、增益的对应关系,其中,一个决策树对应至少一个分裂标志物,一个分裂标志物对应至少一个增益;

7、计算得到一棵决策树中同一个分裂标志物对应的增益平均值,根据决策树在第一xgboost模型中的顺序给每棵决策树赋权重,按照所述权重和每棵决策树中分裂标志物的增益平均值得到每个标志物的总增益;

8、选取n个总增益最大的标志物放入到第一标志物集合中;其中,n为正整数。

9、优选地,所述根据第二xgboost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二xgboost模型中每棵决策树的标志物集合得到第二标志物集合,具体为:

10、解析第二xgboost模型得到每棵决策树中标志物的覆盖度,统计测试集中每个标志物的特征值个数,根据所述覆盖度和所述特征值个数的比值确定每棵决策树对应的标志物集合;

11、统计每棵决策树的标志物集合中标志物出现的次数,选取出现次数最多的n个标志物放入到第二标志物集合中;其中,n为正整数。

12、优选地,所述根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到iga肾病早期诊断标志物,具体为:

13、采用测试集得到第一xgboost模型的准确率,将第一xgboost模型的准确率作为第一标志物集合中每个标志物的贡献度;采用训练集得到第二xgboost模型的准确率,将第二xgboost模型的准确率作为第二标志物集合中每个标志物的贡献度;

14、累加同一个标志物在第一标志物集合中的贡献度和第二标志物集合中的贡献度得到每个标志物的贡献度,按照每个标志物的贡献度的大小选取m个标志物作为iga肾病早期诊断标志物。

15、优选地,所述第一xgboost模型和所述第二xgboost模型的迭代次数、超参数中的树最大深度中的至少一个不同。

16、此外,本专利技术还提供了一种iga肾病早期诊断标志物确定系统,所述系统包括以下模块:

17、数据采集模块,用于访问iga肾病患者早期的电子病历以及非iga肾病患者的早期电子病历,从电子病历中获取预设集合中标志物对应的内容,将所述内容经过编码后,构成iga肾病患者样本和非iga肾病患者样本,并生成训练集和测试集;

18、标志物筛选模块,用于采用训练集训练第一xgboost模型,利用所述训练集训练第一xgboost模型,根据第一xgboost模型中每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合;采用测试集训练第二xgboost模型,根据第二xgboost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二xgboost模型中每棵决策树的标志物集合得到第二标志物集合;

19、标志物确定模块,用于根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到iga肾病早期诊断标志物。

20、优选地,所述根据每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合,具体为:

21、解析第一xgboost模型,记录决策树编号、分裂标志物、增益的对应关系,其中,一个决策树对应至少一个分裂标志物,一个分裂标志物对应至少一个增益;

22、计算得到一棵决策树中同一个分裂标志物对应的增益平均值,根据决策树在第一xgboost模型中的顺序给每棵决策树赋权重,按照所述权重和每棵决策树中分裂标志物的增益平均值得到每个标志物的总增益;

23、选取n个总增益最大的标志物放入到第一标志物集合中;其中,n为正整数。

24、优选地,所述根据第二xgboost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二xgboost模型中每棵决策树的标志物集合得到第二标志物集合,具体为:

25、解析第二xgboost模型得到每棵决策树中标志物的覆盖度,统计测试集中每个标志物的特征值个数,根据所述覆盖度和所述特征值个数的比值确定每棵决策树对应的标志物集合;

26、统计每棵决策树的标志物集合中标志物出现的次数,选取出现次数最多的n个标志物放入到第二标志物集合中;其中,n为正整数。

27、优选地,所述根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到iga肾病早期诊断标志物,具体为:

28、采用测试集得到第一xgboost模型的准确率,将第一xgboost模型的准确率作为第一标志物集合中每个标志物的贡献度;采用训练集得到第二xgboost模型的准确率,将第二xgboost模型的准确率作为第二标志物集合中每个标志物的贡献度;

29、累加同一个本文档来自技高网...

【技术保护点】

1.一种IgA肾病早期诊断标志物确定方法,其特征在于,所述方法包括以下步骤:

2.如权利要求1所述的方法,其特征在于,所述根据每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合,具体为:

3.如权利要求1所述的方法,其特征在于,所述根据第二XGBoost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二XGBoost模型中每棵决策树的标志物集合得到第二标志物集合,具体为:

4.如权利要求1所述的方法,其特征在于,所述根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到IgA肾病早期诊断标志物,具体为:

5.如权利要求1-4任一项所述的方法,其特征在于,所述第一XGBoost模型和所述第二XGBoost模型的迭代次数、超参数中的树最大深度中的至少一个不同。

6.一种IgA肾病早期诊断标志物确定系统,其特征在于,所述系统包括以下模块:

7.如权利要求6所述的系统,其特征在于,所述根据每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合,具体为:

8.如权利要求6所述的系统,其特征在于,所述根据第二XGBoost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二XGBoost模型中每棵决策树的标志物集合得到第二标志物集合,具体为:

9.如权利要求6所述的系统,其特征在于,所述根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到IgA肾病早期诊断标志物,具体为:

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特在在于,所述计算机程序在被处理器执行时实现如权利要求1-5任一项所述的方法。

...

【技术特征摘要】

1.一种iga肾病早期诊断标志物确定方法,其特征在于,所述方法包括以下步骤:

2.如权利要求1所述的方法,其特征在于,所述根据每棵决策树的顺序和每棵决策树中标志物对应的增益计算得到第一标志物集合,具体为:

3.如权利要求1所述的方法,其特征在于,所述根据第二xgboost模型中每棵决策树对应的标志物的覆盖度和标志物对应的特征值个数得到每棵决策树对应的标志物集合,基于第二xgboost模型中每棵决策树的标志物集合得到第二标志物集合,具体为:

4.如权利要求1所述的方法,其特征在于,所述根据第一标志物集合中每个标志物的贡献度和第二标志物集合中每个标志物的贡献度得到iga肾病早期诊断标志物,具体为:

5.如权利要求1-4任一项所述的方法,其特征在于,所述第一xgboost模型和所述第二xgboost模型的迭代次数、超参数中的树最大深度中的至少一个不同。

【专利技术属性】
技术研发人员:宋纯东杨京华刘向哲宋丹贾评评宋珂陈晨晨
申请(专利权)人:河南中医药大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1