癌症组织分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32566646 阅读:10 留言:0更新日期:2022-03-09 16:52
本发明专利技术提供一种癌症组织分类方法、装置、电子设备及存储介质,该方法包括:获取待检组织集对应的基因数据;待检组织包括若干待检组织样本;根据基因数据,确定基因特征矩阵和基因邻接矩阵;将基因特征矩阵和基因邻接矩阵,输入图卷积神经网络,得到多个图卷积网络层;将多个图卷积网络层通过增强图卷积神经网络进行聚合,得到聚合结果;将聚合结果输入分类器进行分类,得到诊断结果。该方案癌症组织分类准确率高。类准确率高。类准确率高。

【技术实现步骤摘要】
癌症组织分类方法、装置、电子设备及存储介质


[0001]本专利技术属于基因识别
,特别涉及一种癌症组织分类方法、装置、电子设备及存储介质。

技术介绍

[0002]癌症疾病的分类研究是一个复杂问题,随着高通量测序的快速发展,使得基因表达谱和基因网络技术的作用日渐突出,也为癌症患者的诊断与决策提供了有力的支持。一方面基因表达谱可以对样本进行疾病分类,另一方面,基因网络的作用在于基因之间的关系描述,倘若某个基因发生突变,会通过基因网络放大影响,过往的研究中,研究人员往往只针对部分基因,而基因网络可涉及多个基因之间的调控关系并存在放大效应,故而考虑多阶邻居基因网络,并将不同阶邻居基因网络信息结合分析可以帮助我们进行疾病分类。
[0003]从网络方法的角度来分析,网络中节点间的相关作用常见的有网络中心度指标,由于网络中心度的方法只是将节点在网络中的位置来评价节点间的重要程度,此方法忽略了节点本身的特征,也无法考虑不同阶邻居距离的节点关系。而目前许多的机器学习算法也被用于疾病检测工作,经典的机器学习算法例如逻辑回归、支持向量机(SVM)分类算法、随机森林以及前馈神经网络都是直接根据样本的基因表达谱对样本进行分类与预测,这些方法均无法进一步处理网络特征。
[0004]现有单一基因表达谱以及网络中心度方法进行癌症组织分类时具有局限性及片面性,且分类准确率低。

技术实现思路

[0005]本说明书实施例的目的是提供一种癌症组织分类方法、装置、电子设备及存储介质。
[0006]为解决上述技术问题,本申请实施例通过以下方式实现的:
[0007]第一方面,本申请提供一种癌症组织分类方法,该方法包括:
[0008]获取待检组织集对应的基因数据;待检组织包括若干待检组织样本;
[0009]根据基因数据,确定基因特征矩阵和基因邻接矩阵;
[0010]将基因特征矩阵和基因邻接矩阵,输入图卷积神经网络,得到多个图卷积网络层;
[0011]将多个图卷积网络层通过增强图卷积神经网络进行聚合,得到聚合结果;
[0012]将聚合结果输入分类器进行分类,得到诊断结果。
[0013]在其中一个实施例中,基因数据包括基因表达谱数据及对应的基因关系网络数据;
[0014]根据基因数据,确定基因特征矩阵和基因邻接矩阵,包括:
[0015]根据基因表达谱数据,确定基因特征矩阵;
[0016]根据基因关系网络数据,构建基因邻接矩阵。
[0017]在其中一个实施例中,每个待检组织样本包括若干特征,所有待检组织样本的特
征构成特征矩阵;
[0018]根据基因表达谱数据,确定基因特征矩阵,包括:
[0019]归一化特征矩阵,得到稀疏矩阵;
[0020]存储稀疏矩阵,得到基因特征矩阵。
[0021]在其中一个实施例中,基因关系网络数据包括网络节点和网络边,网络节点为基因特征,网络边表征网络节点之间的关系;
[0022]根据基因关系网络数据,构建基因邻接矩阵,包括:
[0023]根据网络节点和网络边,确定基因邻接矩阵。
[0024]在其中一个实施例中,将基因特征矩阵和基因邻接矩阵,输入图卷积神经网络,得到多个图卷积网络层,包括:
[0025]将基因邻接矩阵A通过拉普拉斯矩阵L=D-A进行变换,标准化后为:其中,I
n
为单位矩阵;
[0026]使用重整化方法将转化为其中,其中,为对应的度矩阵;
[0027]根据上述转换,得到图卷积神经网络的第l+1层隐藏层节点特征为:
[0028][0029]其中,σ为激活函数,b
(l)
为第l层的偏置值;
[0030]令通过堆叠多层图卷积神经网络,得到多阶邻居的关系:
[0031][0032]…
[0033][0034]…
[0035][0036]其中,H
(1)
,H
(2)
,...,H
(l)
,H
(out)
为各层隐藏层节点特征,b
(in)
,...,b
(l)
,b
(out)
为各层的偏置值,Y为输出数据,f(
·
)为softmax(
·
)函数。
[0037]在其中一个实施例中,将多个图卷积网络层通过增强图卷积神经网络进行聚合,采用拼接聚合或注意力加权拼接聚合。
[0038]在其中一个实施例中,根据基因数据,确定基因特征矩阵和基因邻接矩阵,包括:
[0039]预处理基因数据,得到预处理后基因数据;
[0040]根据预处理后基因数据,确定基因特征矩阵和基因邻接矩阵。
[0041]第二方面,本申请提供一种癌症组织分类装置,该装置包括:
[0042]获取模块,用于获取待检组织集对应的基因数据;待检组织包括若干待检组织样本;
[0043]确定模块,用于根据基因数据,确定基因特征矩阵和基因邻接矩阵;
[0044]处理模块,用于将基因特征矩阵和基因邻接矩阵,输入图卷积神经网络,得到多个
图卷积网络层;
[0045]聚合模块,用于将多个图卷积网络层通过增强图卷积神经网络进行聚合,得到聚合结果;
[0046]分类模块,用于将聚合结果输入分类器进行分类,得到诊断结果。
[0047]第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面的癌症组织分类方法。
[0048]第四方面,本申请提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面的癌症组织分类方法。
[0049]由以上本说明书实施例提供的技术方案可见,该方案通过图卷积神经网络可以融合基因表达谱数据与基因关系网络数据,解决了现有方法进行癌症组织分类时具有局限性及片面性,且分类准确率低的缺陷。
附图说明
[0050]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0051]图1为本申请提供的癌症组织分类方法的流程示意图;
[0052]图2为本申请提供的癌症组织分类装置的结构示意图;
[0053]图3为本申请提供的电子设备的结构示意图。
具体实施方式
[0054]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种癌症组织分类方法,其特征在于,所述方法包括:获取待检组织集对应的基因数据;所述待检组织包括若干待检组织样本;根据所述基因数据,确定基因特征矩阵和基因邻接矩阵;将所述基因特征矩阵和所述基因邻接矩阵,输入图卷积神经网络,得到多个图卷积网络层;将所述多个图卷积网络层通过增强图卷积神经网络进行聚合,得到聚合结果;将所述聚合结果输入分类器进行分类,得到诊断结果。2.根据权利要求1所述的方法,其特征在于,所述基因数据包括基因表达谱数据及对应的基因关系网络数据;所述根据所述基因数据,确定基因特征矩阵和基因邻接矩阵,包括:根据所述基因表达谱数据,确定基因特征矩阵;根据所述基因关系网络数据,构建基因邻接矩阵。3.根据权利要求2所述的方法,其特征在于,每个所述待检组织样本包括若干特征,所有所述待检组织样本的特征构成特征矩阵;所述根据所述基因表达谱数据,确定基因特征矩阵,包括:归一化所述特征矩阵,得到稀疏矩阵;存储所述稀疏矩阵,得到所述基因特征矩阵。4.根据权利要求2所述的方法,其特征在于,所述基因关系网络数据包括网络节点和网络边,所述网络节点为基因特征,所述网络边表征所述网络节点之间的关系;根据所述基因关系网络数据,构建基因邻接矩阵,包括:根据所述网络节点和所述网络边,确定所述基因邻接矩阵。5.根据权利要求1

4任一项所述的方法,其特征在于,所述将所述基因特征矩阵和所述基因邻接矩阵,输入图卷积神经网络,得到多个图卷积网络层,包括:将所述基因邻接矩阵A通过拉普拉斯矩阵L=D-A进行变换,标准化后为:其中,I
n
为单位矩阵;使用重整化方法将转化为其中,其中,为对应的度矩阵;根据上述转换,得到所述图卷积神经网络的第l+1层隐藏层节点特征为:其中,σ为激活函数,b
(l)
为第l层的偏置值;令通过堆叠多层所述图卷积神经网络,得到多阶邻居的关系:
……
...

【专利技术属性】
技术研发人员:金鑫张卓辉杨虎
申请(专利权)人:中央财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1