一种疾病进展评估模型的构建方法、装置及存储介质制造方法及图纸

技术编号:38140986 阅读:8 留言:0更新日期:2023-07-08 09:55
本发明专利技术公开一种疾病进展评估模型的构建方法、装置及存储介质。本发明专利技术通过癌症患者的临床指标和信息开发了能够精确评估多癌种复发转移的生物标志物,同时本发明专利技术不仅考虑了微生物丰度,而且量化了微生物群落之间的变化。此外,本发明专利技术还对生物标志物、评估模型和预后方法进行了验证,结果与临床患者生存率和预后表现一致,进一步证明了本发明专利技术鉴定的生物标记物、评估模型和预后方法的高精度和临床意义。评估模型和预后方法的高精度和临床意义。评估模型和预后方法的高精度和临床意义。

【技术实现步骤摘要】
一种疾病进展评估模型的构建方法、装置及存储介质


[0001]本专利技术涉及生物
,具体地涉及一种疾病进展评估模型的构建方法、装置及存储介质,特别涉及一种结合物种丰度变化和种间相互作用来识别多癌种复发转移的生物标志物及评估预后的方法。

技术介绍

[0002]捕获癌症患者的复发或转移信号(RM)并在手术后持续监测癌症进展对于改善患者的预后具有重要意义。
[0003]肿瘤内的细菌群体是肿瘤类型特异性的,提示在肿瘤发生中起作用。虽然不同肿瘤组织的微生物群有显著差异,但有报道称一些癌症有共享的组织微生物群。因此,微生物可能在某些肿瘤的复发或转移中起相似的功能。探索组织微生物在多种癌症复发和转移中的潜在功能,并确定与复发和转移相关的细菌标志物至关重要。
[0004]在疾病微生物组研究中,识别微生物标记至关重要且必不可少。在与宿主疾病相关的微生物群的研究中,健康状态和患病状态之间的分类学丰度差异通常用于鉴定微生物标记,而丰度高的微生物通常用作疾病的显著标记。然而众所周知,在确定宿主健康时,不能忽略宿主内共同生活的相互关联的微生物的综合作用。结合对物种丰度变化的考虑和对微生物群落的变化进行量化,可以从二维过渡到多维,从而有助于识别可能充当“疾病驱动因素”的微生物。
[0005]因此,在面对多癌种复发转移问题时,仍需要一种能够科学评估癌症预后的方法。
[0006]
技术介绍
中的信息仅仅在于说明本专利技术的总体背景,不应视为承认或以任何形式暗示这些信息构成本领域一般技术人员所公知的现有技术。

技术实现思路

[0007]为解决现有技术中的至少部分技术问题,本专利技术提供了结合物种丰度变化和物种之间的相互作用的多癌种复发和转移的生物标志物以及癌症评估预后的方法。具体地,本专利技术包括以下内容。
[0008]本专利技术的第一方面,提供一种疾病进展评估模型的构建方法,其包括以下步骤:
[0009](1)提供生物样本的组织微生物组学信息数据和对应的临床指标数据,其中,所述微生物组学信息数据包含微生物丰度数据和微生物类型数据,所述临床指标数据包括疾病类型数据和疾病进展数据;
[0010](2)对于每种疾病类型,分别以微生物属的丰度数据作为输入特征,以疾病进展作为分类特征构建机器学习模型,根据所得模型的性能筛选得到候选疾病类型组;
[0011](3)在候选疾病类型组中,确定在疾病类型相同但疾病进展不同的组别中微生物丰度存在差异的微生物类型,整合所述候选疾病类型组中各组的微生物类型得到丰度差异微生物组;
[0012](4)在候选疾病类型组中,根据微生物种间相互作用筛选驱动候选疾病类型组中
各组对应的疾病进展的驱动微生物组;和
[0013](5)将丰度差异微生物组和驱动微生物组整合为标志物组,利用所述标志物组进一步构建机器学习模型得到评估模型。
[0014]在某些实施方案中,根据本专利技术所述的疾病进展评估模型的构建方法,其中,步骤(2)和(5)各自的所述机器学习模型包括线性回归算法、逻辑回归算法、朴素贝叶斯算法、k

近邻算法、支持向量机算法、决策树算法、随机森林算法、k

平均算法和梯度增强算法中的至少一种。
[0015]在某些实施方案中,根据本专利技术所述的疾病进展评估模型的构建方法,其中,步骤(2)中,使用交叉验证和重要性排序进行特征选择并通过平均曲线下面积和准确性估计分类算法的性能。
[0016]在某些实施方案中,根据本专利技术所述的疾病进展评估模型的构建方法,其中,步骤(3)中进一步包括通过降维方法和统计学检验确定微生物在癌种之间的差异和相似性,其中所述降维方法包括进行T分布随机近邻嵌入的步骤。
[0017]在某些实施方案中,根据本专利技术所述的疾病进展评估模型的构建方法,步骤(4)中,通过NetShift引入邻居移位分数确定驱动节点,将定义为驱动节点的微生物确定为所述驱动微生物。
[0018]在某些实施方案中,根据本专利技术所述的疾病进展评估模型的构建方法,其中,所述模型为多癌种复发转移评估模型,所述标志物组包括农研丝杆菌属、Schlesneria、硫代碱弧菌属、暗棕色杆菌属、球衣菌属、硫单胞菌属、劳森氏菌属、放线杆菌属和螺原体属。
[0019]所述模型包括所述标志物组包括农研丝杆菌属Niastella、Schlesneria、硫代碱弧菌属Thioalkalivibrio、暗棕色杆菌Phaeobacter、球衣菌属Sphaerotilus、硫单胞菌属Thiomonas、劳森氏菌属Lawsonia、放线杆菌属Actinobacillus和螺原体属Spiroplasma。
[0020]本专利技术的第二方面,提供一种用于多癌种复发转移评估的组合物,其包括用于检测以下微生物的试剂:农研丝杆菌属Niastella、Schlesneria、硫代碱弧菌属Thioalkalivibrio、暗棕色杆菌Phaeobacter、球衣菌属Sphaerotilus、硫单胞菌属Thiomonas、劳森氏菌属Lawsonia、放线杆菌属Actinobacillus和螺原体属Spiroplasm。
[0021]本专利技术的第三方面,提供一种疾病进展评估模型,其通过第一方面的方法得到,其中,所述模型包括预测或评估标志物组,所述标志物组包括农研丝杆菌属Niastella、Schlesneria、硫代碱弧菌属Thioalkalivibrio、暗棕色杆菌Phaeobacter、球衣菌属Sphaerotilus、硫单胞菌属Thiomonas、劳森氏菌属Lawsonia、放线杆菌属Actinobacillus和螺原体属Spiroplasm。
[0022]本专利技术的第四方面,提供一种疾病进展评估装置,其包括:
[0023]a.数据采集单元,其设置为能够获取来自生物样本的微生物组学信息数据,其中所述微生物组学信息数据包含微生物丰度数据和微生物类型数据;
[0024]b.预测单元,其设置为当将所述微生物组学信息数据输入预测模型后能够输出疾病进展,特别是多癌症的复发转移评估结果;
[0025]其中,所述预测模型为根据第一方面上述的方法构建的疾病进展评估模型。
[0026]在某些实施方案中,根据本专利技术所述的疾病进展评估装置,其中,进一步包括显示单元,用于显示多癌种复发转移结果。
[0027]本专利技术的第五方面,提供一种计算机存储介质或云端,其中存储有计算机程序,所述计算机程序被计算机执行时实现根据第一方面所述的构建方法,或包括第三方面所述的疾病进展评估装置。
[0028]本专利技术通过对癌症患者的临床指标和信息研究,发现了能够精确评估多癌种复发转移的生物标志物,同时本专利技术的评估模型和预后方法结合微生物标志物的物种分度和种间相互作用,消除了现有技术中仅使用单一或细菌标志物组合鉴定方法的研究的缺点,本专利技术不仅考虑了微生物丰度,而且量化了微生物群落之间的变化。此外,本专利技术还对特定生物标志物、评估模型和预后方法进行了验证,结果表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种疾病进展评估模型的构建方法,其特征在于,包括以下步骤:(1)提供生物样本的组织微生物组学信息数据和对应的临床指标数据,其中,所述微生物组学信息数据包含微生物丰度数据和微生物类型数据,所述临床指标数据包括疾病类型数据和疾病进展数据;(2)对于每种疾病类型,分别以微生物属的丰度数据作为输入特征,以疾病进展作为分类特征构建机器学习模型,根据所得模型的性能筛选得到候选疾病类型组;(3)在候选疾病类型组中,确定在疾病类型相同但疾病进展不同的组别中微生物丰度存在差异的微生物类型,整合所述候选疾病类型组中各组的微生物类型得到丰度差异微生物组;(4)在候选疾病类型组中,根据微生物种间相互作用筛选驱动候选疾病类型组中各组对应的疾病进展的驱动微生物组;和(5)将丰度差异微生物组和驱动微生物组整合为标志物组,利用所述标志物组进一步构建机器学习模型得到评估模型。2.根据权利要求1所述的疾病进展评估模型的构建方法,其特征在于,步骤(2)和(5)各自的所述机器学习模型包括线性回归算法、逻辑回归算法、朴素贝叶斯算法、k

近邻算法、支持向量机算法、决策树算法、随机森林算法、k

平均算法和梯度增强算法中的至少一种。3.根据权利要求2所述的疾病进展评估模型的构建方法,其特征在于,步骤(2)中,使用交叉验证和重要性排序进行特征选择并通过平均曲线下面积和准确性估计分类算法的性能。4.根据权利要求1所述的疾病进展评估模型的构建方法,其特征在于,步骤(3)中进一步包括通过降维方法和统计学检验确定微生物在癌种之间的差异和相似性,其中所述降维方...

【专利技术属性】
技术研发人员:杨家亮计磊张钰萌储玉文苑雪莲田埂
申请(专利权)人:北京元码医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1