System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多组学数据融合的胃癌分类方法及系统技术方案_技高网

一种基于多组学数据融合的胃癌分类方法及系统技术方案

技术编号:41257718 阅读:4 留言:0更新日期:2024-05-11 09:17
本发明专利技术公开了一种基于多组学数据融合的胃癌分类方法及系统,涉及生物信息学技术领域,该基于多组学数据融合的胃癌分类方法包括以下步骤:采集胃癌患者的组织病理学数据集、基因表达数据集及miRNA数据集,并计算各数据集之间的关联性差异;融合组织病理学数据集、基因表达数据集及miRNA数据集,形成生物融合数据集,并对生物融合数据集进行异常数据检测;将生物融合数据集结合各数据集之间的关联性差异构建非平衡采样的迁移分类模型;结合胃癌患者的历史临床病例,利用迁移分类模型对胃癌患者的胃癌发展阶段进行分类。本发明专利技术能够更准确地了解肿瘤的扩散范围,为浸润深度特征的评估提供更多有益的信息。

【技术实现步骤摘要】

本专利技术涉及生物信息学,具体来说,涉及一种基于多组学数据融合的胃癌分类方法及系统


技术介绍

1、胃癌是一种恶性肿瘤,起源于胃部组织,它通常发展缓慢,早期没有明显症状,胃癌在全球范围内都是一种常见的癌症类型,胃癌的发生与多种因素有关,包括遗传因素、饮食习惯、幽门螺杆菌感染、吸烟和酗酒等,常见的胃癌类型包括腺癌(最常见)、黏液癌、鳞癌和神经内分泌肿瘤。

2、胃癌的分类目的在于根据不同的病理特征、临床表现和分子生物学特征,将患者分成不同的亚型或阶段,以便更好地进行预后预测、治疗选择和临床管理。通过对胃癌进行分类,可以帮助医生预测患者的预后,不同分类的胃癌可能具有不同的生物学行为和预后,例如分化程度高的胃癌可能预后较好,而未分化型胃癌可能预后较差,通过分类,医生可以更准确地评估患者的预后,为患者提供更个体化的治疗建议。

3、然而,在胃癌分类方法中,如果采集的数据样本不平衡,可能会导致分类模型的偏向性,这意味着分类模型在对占多数的类别进行分类时效果较好,而对少数类别的分类效果较差,样本不平衡会影响模型的预测准确性,使得对少数类别的识别和预测能力下降,进而导致整体分类准确性下降,并且会使得对少数类别的重要信息无法被充分挖掘和利用。

4、针对相关技术中的问题,目前尚未提出有效的解决方案。


技术实现思路

1、针对相关技术中的问题,本专利技术提出一种基于多组学数据融合的胃癌分类方法及系统,以克服现有相关技术所存在的上述技术问题。

2、为此,本专利技术采用的具体技术方案如下:

3、根据本专利技术的一个方面,提供了一种基于多组学数据融合的胃癌分类方法,该基于多组学数据融合的胃癌分类方法包括以下步骤:

4、s1、采集胃癌患者的组织病理学数据集、基因表达数据集及mirna数据集,并计算各数据集之间的关联性差异;

5、s2、融合组织病理学数据集、基因表达数据集及mirna数据集,形成生物融合数据集,并对生物融合数据集进行异常数据检测;

6、s3、将生物融合数据集结合各数据集之间的关联性差异构建非平衡采样的迁移分类模型;

7、s4、结合胃癌患者的历史临床病例,利用迁移分类模型对胃癌患者的胃癌发展阶段进行分类。

8、优选地,采集胃癌患者的组织病理学数据集、基因表达数据集及mirna数据集,并计算各数据集之间的关联性差异包括以下步骤:

9、s11、采集胃癌患者的镜下组织切片图像数据,并从镜下组织切片图像数据中提取胃癌患者的细胞组织结构,评估肿瘤的浸润深度特征;

10、s12、利用rna测序技术从胃癌患者的胃组织中进行rna提取并转录成基因序列特征;

11、s13、利用基因芯片测序技术从胃癌患者的胃组织中提取mirna表达特征;

12、s14、计算浸润深度特征、基因序列特征及mirna表达特征之间的关联性差异,并基于关联性差异结果总结各个特征在分子水平上的协同作用。

13、优选地,采集胃癌患者的镜下组织切片图像数据,并从镜下组织切片图像数据中提取胃癌患者的细胞组织结构,评估肿瘤的浸润深度特征包括以下步骤:

14、s111、采集胃癌患者的镜下组织切片图像,并对组织切片图像预处理;

15、s112、分割各个组织切片图像,将分割后的组织切片图像中rgb通道的颜色平均值作为当前图像的代表颜色,并对颜色平均值进行余弦变化,得到余弦变换矩阵;

16、s113、基于余弦变换矩阵计算组织切片图像之间的颜色距离,并计算出各像素点的灰度值,同时将各组织切片图像转换为灰度图像;

17、s114、利用灰度共生矩阵从灰度图像中定量描述各细胞纹理特征,并利用形态学分析技术分析细胞纹理特征的细胞组织结构,其中,细胞组织结构至少包括细胞核的大小、形态及排列方式;

18、s115、分析相邻帧的灰度图像,并利用动态轨迹扩散算法分析各细胞的动态扩散行为与组织边界间的约束关系;

19、s116、基于细胞的动态扩散行为判断肿瘤的扩散范围,并基于肿瘤的扩散范围判断肿瘤的浸润深度特征。

20、优选地,分析相邻帧的灰度图像,并利用轨迹扩散算法分析各细胞的动态扩散行为与组织边界间的约束关系包括以下步骤:

21、s1151、分析相邻帧的灰度图像生成目标域样本,并基于目标域样本生成细胞群;

22、s1152、评价细胞群中每个细胞的适应值,并将细胞群中适应值最高的细胞设为细胞引导者,总结细胞引导者与各细胞间的扩散行为;

23、s1153、从病理数据库中寻找与之相匹配的细胞间的扩散行为,若存在,则执行步骤s1154,否则,则执行步骤s1152-s1153;

24、s1154、循环执行细胞引导者与各细胞间的扩散行为,并不断更新细胞群的扩散位置,同时更新细胞群中所有细胞的适应值;

25、s1155、基于更新后的细胞群中各细胞的扩散位置及适应值,分析各细胞的动态扩散行为与组织边界间的约束关系。

26、优选地,计算浸润深度特征、基因序列特征及mirna表达特征之间的关联性差异,并基于关联性差异结果总结各个特征在分子水平上的协同作用包括以下步骤:

27、s141、引入浸润深度特征、基因序列特征及mirna表达特征的特征点;

28、s142、计算特征点的活跃性和影响力,构建特征关联度度量模型;

29、s143、结合特征点度量准则,选取影响力最大的特征点作为浸润深度特征、基因序列特征及mirna表达特征之间的中心特征点;

30、s144、利用特征关联度度量模型计算相邻特征点之间的关联度,并通过选择关联度最小的特征点向中心特征点聚集,降低因相邻中心点之间的关联误差;

31、s145、基于相邻特征点之间的关联度得到浸润深度特征、基因序列特征及mirna表达特征之间的关联性差异参数,并总结各个特征在分子水平上的协同作用。

32、优选地,融合组织病理学数据集、基因表达数据集及mirna数据集,形成生物融合数据集,并对生物融合数据集进行异常数据检测包括以下步骤:

33、s21、利用多模态结合的方式将组织病理学数据集、基因表达数据集及mirna数据集融合,形成生物融合数据集;

34、s22、对物融合数据集应用滑动窗口技术并构造特征矩阵捕捉多模态特征;

35、s23、根据多模态特征设计多模态编码器、多模态生成器及多模态判别器,并将物融合数据集及多模态特征分别输入至多模态编码器和多模态生成器中,输出具有生物特征的多模态特征矩阵;

36、s24、将具有生物特征的多模态特征矩阵作为多模态判别器的输入,并利用惩罚函数对多模态判别器进行训练,通过多模态判别器检测生物融合数据集误差并修正。

37、优选地,将生物融合数据集结合各数据集之间的关联性差异构建非平衡采样的迁移分类模型包括以下步骤:...

【技术保护点】

1.一种基于多组学数据融合的胃癌分类方法,其特征在于,该基于多组学数据融合的胃癌分类方法包括以下步骤:

2.根据权利要求1所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述采集胃癌患者的组织病理学数据集、基因表达数据集及miRNA数据集,并计算各数据集之间的关联性差异包括以下步骤:

3.根据权利要求2所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述采集胃癌患者的镜下组织切片图像数据,并从镜下组织切片图像数据中提取胃癌患者的细胞组织结构,评估肿瘤的浸润深度特征包括以下步骤:

4.根据权利要求3所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述分析相邻帧的灰度图像,并利用轨迹扩散算法分析各细胞的动态扩散行为与组织边界间的约束关系包括以下步骤:

5.根据权利要求4所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述计算浸润深度特征、基因序列特征及miRNA表达特征之间的关联性差异,并基于关联性差异结果总结各个特征在分子水平上的协同作用包括以下步骤:

6.根据权利要求5所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述融合组织病理学数据集、基因表达数据集及miRNA数据集,形成生物融合数据集,并对生物融合数据集进行异常数据检测包括以下步骤:

7.根据权利要求6所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述将生物融合数据集结合各数据集之间的关联性差异构建非平衡采样的迁移分类模型包括以下步骤:

8.根据权利要求7所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述利用数据动态剔除算法剔除迁移数据集中的冗余数据包括以下步骤:

9.根据权利要求8所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述迁移分类模型的表达式为:

10.一种基于多组学数据融合的胃癌分类系统,用于实现权利要求1-9中任一项所述的基于多组学数据融合的胃癌分类方法,其特征在于,该基于多组学数据融合的胃癌分类系统包括关联性差异计算模块、数据融合模块、分类模型构建模块及胃癌分类模块;

...

【技术特征摘要】

1.一种基于多组学数据融合的胃癌分类方法,其特征在于,该基于多组学数据融合的胃癌分类方法包括以下步骤:

2.根据权利要求1所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述采集胃癌患者的组织病理学数据集、基因表达数据集及mirna数据集,并计算各数据集之间的关联性差异包括以下步骤:

3.根据权利要求2所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述采集胃癌患者的镜下组织切片图像数据,并从镜下组织切片图像数据中提取胃癌患者的细胞组织结构,评估肿瘤的浸润深度特征包括以下步骤:

4.根据权利要求3所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述分析相邻帧的灰度图像,并利用轨迹扩散算法分析各细胞的动态扩散行为与组织边界间的约束关系包括以下步骤:

5.根据权利要求4所述的一种基于多组学数据融合的胃癌分类方法,其特征在于,所述计算浸润深度特征、基因序列特征及mirna表达特征之间的关联性差异,并基于关联性差异结果总结各个特征在分子水平上的协同...

【专利技术属性】
技术研发人员:吴寒王霏
申请(专利权)人:南通大学附属医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1