当前位置: 首页 > 专利查询>山东大学专利>正文

基于不完整多组学数据的癌症诊断系统技术方案

技术编号:34963909 阅读:21 留言:0更新日期:2022-09-17 12:44
本公开提供了一种基于不完整多组学数据的癌症诊断系统,其属于人工智能数据挖掘分类以及生物信息学技术领域,包括:数据获取模块,其被配置为:获取同一患者全部可用待诊断组学数据;组学数据特征提取模块,其被配置为:对获得的不同组学数据分别进行特征提取;缺失组学数据生成模块,其被配置为:根据患者对应的组学数据,基于生成对抗策略生成患者的缺失组学数据,并进行特征提取;多组学特征融合与诊断模块,其被配置为:将提取到的患者的组学数据特征以及生成的组学数据特征进行融合,将融合特征输入到预先训练的诊断网络模型中,获得诊断结果。断结果。断结果。

【技术实现步骤摘要】
基于不完整多组学数据的癌症诊断系统


[0001]本公开属于人工智能数据挖掘分类以及生物信息学
,尤其涉及一种基于不完整多组学数据的癌症诊断系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。
[0003]在当前癌症大流行的背景下,通过采用患者的组学数据来对患者癌症类型进行精准划分就显得尤为重要,因为不同类型的癌症往往需要采用不同的治疗手段。相比于采用单一组学数据进行癌症诊断,多种组学数据的融合会使得患者的特征更加丰富,从而可以进一步提升诊断的精准度。但由于部分检测手段的高成本、有创性以及法律和伦理约束等因素,不完整多组学数据在现实生物世界中无处不在,如何根据这些不完整多组学数据实现患者更加精准的癌症诊断,是当前机器学习技术在癌症诊断中仍待提升的难点。
[0004]专利技术人发现,目前在不完整多组学数据下进行诊断的方法有:排除组学数据中缺失的样本后训练并诊断;确保患者其中一种组学数据完整后训练并诊断;根据组学数据可用性分别构建模型后训练并诊断;将各组学数据提取到相同维度特征空间进行融合后训练并诊断等方法。但是,这些依赖于先决条件的训练方法严重限制了他们在临床中的实际应用,此外,在相同维度特征空间进行融合的方法只追求各个组学数据的共性特征,从而忽略了每个组学数据的个性特征,使得癌症的精准诊断在机器学习技术中还存在较多的改进空间。

技术实现思路

[0005]本公开为了解决上述问题,提供了一种基于不完整多组学数据的癌症诊断系统,所述方案通过基于注意力的特征提取网络对组学特征进行提取,并通过共享损失与个性损失的联和优化使得组学特征表示具有良好的差异性,特征提取网络中的注意力参数既可以缓解因组学数据的高维性带来的过拟合问题又能使得该系统具备良好的可解释性与真实性;然后通过生成对抗策略来对患者缺失的组学数据进行生成,从而丰富患者的特征表示,使得哪怕仅有一种组学数据可用也可以实现灵活的癌症诊断;最后将各个组学数据特征进行融合并输入融合特征诊断网络,从而得到患者关于癌症的更为精准的诊断结果。
[0006]根据本公开实施例的第一个方面,提供了一种基于不完整多组学数据的癌症诊断系统,包括:
[0007]数据获取模块,其被配置为:获取同一患者全部可用待诊断组学数据;
[0008]组学数据特征提取模块,其被配置为:对获得的不同组学数据分别进行特征提取;
[0009]缺失组学数据生成模块,其被配置为:根据患者对应的组学数据,基于生成对抗策略生成患者的缺失组学数据,并进行特征提取;
[0010]多组学特征融合与诊断模块,其被配置为:将提取到的患者的组学数据特征以及
生成的组学数据特征进行融合,将融合特征输入到预先训练的诊断网络模型中,获得诊断结果。
[0011]进一步的,所述对获得的不同组学数据分别进行特征提取,具体为:
[0012]对各个组学数据特征分别构建注意力参数层;
[0013]构建对应各组学数据的特征提取网络进行特征提取;
[0014]根据提取到的特征计算共享损失;
[0015]根据提取到的特征计算个性损失。
[0016]进一步的,根据患者对应的组学数据,基于生成对抗策略生成患者的缺失组学数据,具体为:
[0017]根据提取的组学数据特征生成缺失组学数据;
[0018]基于可用组学数据对应的真实数据与生成的组学数据计算生成损失与对抗损失;
[0019]对各组学数据的生成损失与对抗损失进行整合,计算生成对抗损失。
[0020]进一步的,根据提取的组学数据特征生成缺失组学数据;具体为:
[0021]通过患者可用组学数据的提取特征来计算患者对应于各个组学数据的潜在特征
[0022]将对应于相应组学数据的潜在特征输入对应于相应组学数据的生成网络G
v
(
·
)中来生成患者缺失的组学数据具体表示如下:
[0023][0024]其中,G
v
(
·
)是用于生成第v种组学数据的生成器,是生成的患者缺失的第v种组学数据。
[0025]进一步的,所述基于可用组学数据对应的真实数据与生成的组学数据计算生成损失与对抗损失;具体为:将患者可用组学数据中的真实数据与可用组学数据中的生成数据输入对应于相应组学数据的鉴别网络D
v
(
·
),根据鉴别结果分别计算相应组学下的生成损失与对抗损失具体表示如下:
[0026][0027][0028]其中,D
v
(
·
)是对应于第v种组学数据的鉴别器,其输出为0到1,值越小代表鉴别器认为该组学数据为生成数据的可能性越高;为表示组学数据是否缺失的指示矩阵。
[0029]进一步的,将提取到的患者的组学数据特征以及生成的组学数据特征进行融合,具体为:将患者的组学数据特征以及生成的组学数据特征进行拼接融合。
[0030]进一步的,对各组学数据的生成损失与对抗损失进行整合,计算生成对抗损失,具
体表示如下:
[0031][0032]通过优化GLoss,可以在生成与对抗的过程中不断完善生成对抗网络的性能,从而生成出近似于真实数据的缺失组学数据。
[0033]根据本公开实施例的第二个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现如下过程:
[0034]获取同一患者全部可用待诊断组学数据;
[0035]对获得的不同组学数据分别进行特征提取;
[0036]根据患者对应的组学数据,基于生成对抗策略生成患者的缺失组学数据,并进行特征提取;
[0037]将提取到的患者的组学数据特征以及生成的组学数据特征进行融合,将融合特征输入到预先训练的诊断网络模型中,获得诊断结果。
[0038]根据本公开实施例的第三个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如下过程:
[0039]获取同一患者全部可用待诊断组学数据;
[0040]对获得的组学数据进行特征提取;
[0041]根据患者可用组学数据,基于生成对抗策略生成患者的缺失组学数据;
[0042]将提取到的患者的可用特征以及生成的组学数据特征进行融合,将融合特征输入到预先训练的诊断网络模型中,获得诊断结果。
[0043]根据本公开实施例的第四个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于执行以下步骤:
[0044]获取同一患者全部可用待诊断组学数据;
[0045]对获得的组学数据进行特征提取;
[0046]根据患者可用组学数据,基于生成对抗策略生成患者的缺失组学数据;
[0047]将提取到的患者的可用特征以及生成的组学数据特征进行融合,将融合特征输入到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于不完整多组学数据的癌症诊断系统,其特征在于,包括:数据获取模块,其被配置为:获取同一患者全部可用待诊断组学数据;组学数据特征提取模块,其被配置为:对获得的不同组学数据分别进行特征提取;缺失组学数据生成模块,其被配置为:根据患者对应的组学数据,基于生成对抗策略生成患者的缺失组学数据,并进行特征提取;多组学特征融合与诊断模块,其被配置为:将提取到的患者的组学数据特征以及生成的组学数据特征进行融合,将融合特征输入到预先训练的诊断网络模型中,获得诊断结果。2.如权利要求1所述的一种基于不完整多组学数据的癌症诊断系统,其特征在于,所述对获得的不同组学数据分别进行特征提取,具体为:对各个组学数据特征分别构建注意力参数层;构建对应各组学数据的特征提取网络进行特征提取;根据提取到的特征计算共享损失;根据提取到的特征计算个性损失。3.如权利要求1所述的一种基于不完整多组学数据的癌症诊断系统,其特征在于,根据患者对应的组学数据,基于生成对抗策略生成患者的缺失组学数据,具体为:根据提取的组学数据特征生成缺失组学数据;基于可用组学数据对应的真实数据与生成的组学数据计算生成损失与对抗损失;对各组学数据的生成损失与对抗损失进行整合,计算生成对抗损失。4.如权利要求3所述的一种基于不完整多组学数据的癌症诊断系统,其特征在于,根据提取的组学数据特征生成缺失组学数据;具体为:通过患者可用组学数据的提取特征来计算患者对应于各个组学数据的潜在特征将对应于相应组学数据的潜在特征输入对应于相应组学数据的生成网络G
v
(
·
)中来生成患者缺失的组学数据具体表示如下:其中,G
v
(
·
)是用于生成第v种组学数据的生成器,是生成的患者缺失的第v种组学数据。5.如权利要求3所述的一种基于不完整多组学数据的癌症诊断系统,其特征在于,所述基于可用组学数据对应的真实数据与生成的组学数据计算生成损失与对抗损失;具体为:将患者可用组学数据中的真实数据与可用组学数据中的生成数据输入对应于相应组学数据的鉴别网络D
v
(
·
...

【专利技术属性】
技术研发人员:余国先王星泽王峻郭伟崔立真
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1