当前位置: 首页 > 专利查询>厦门大学专利>正文

基于多组学数据整合的药物敏感性分类方法、系统及设备技术方案

技术编号:37669095 阅读:47 留言:0更新日期:2023-05-26 04:29
本发明专利技术公开一种基于多组学数据整合的药物敏感性分类方法、系统及设备,涉及药物敏感性分类领域。本发明专利技术方法使用联合非负矩阵分解对所有多组学数据样本的多个组学矩阵进行分解,得到的共享矩阵表示所有样本的线性整合特征;同时使用变分自编码器(VAE)得到所有样本的非线性整合特征;由线性整合特征、非线性整合特征以及药物特征拼接获得的拼接后特征向量用于药物敏感性分类。其中线性整合特征包含所有组学的重要信息,消除了原始数据中的噪声,非线性整合特征包含多组学数据中的非线性和复杂关系信息,本发明专利技术利用两种特征的互补性,挖掘多组学数据间的潜在信息,从而极大提高了药物敏感性分类的准确率。高了药物敏感性分类的准确率。高了药物敏感性分类的准确率。

【技术实现步骤摘要】
基于多组学数据整合的药物敏感性分类方法、系统及设备


[0001]本专利技术涉及药物敏感性分类
,特别是涉及一种基于多组学数据整合的药物敏感性分类方法、系统及设备。

技术介绍

[0002]药物敏感性分类是药物设计和发现的重要步骤之一。因为药物的设计与发现是一个极其漫长的过程,所以药物敏感性分类是一个非常有意义的任务,也是一项巨大的挑战。准确的药物敏感性分类有利于挑选有潜力的药物从而辅助药物筛选。
[0003]随着医学放射组学和高通量技术的发展,现代生物医学研究中多组学数据呈爆炸式增长。对于同一个生物样本,可以使用不同的生物技术获取不同的组学信息。组学数据包括基因表达、DNA甲基化等。虽然单组学数据可以从某一角度描述生物特性,但是它包含的信息非常有限,不能描述生物的细微差别。整合多组学数据可以同时从多个角度更全面地描述生物特性。现有研究表明,多组学数据对于药物敏感性分类有重要作用,整合多组学数据相比于仅使用单组学数据可以明显提高药物敏感性的分类准确率。因此寻找一种能够对多组学数据进行有效整合和药物敏感性分类的方法是非常有必要的。...

【技术保护点】

【技术特征摘要】
1.一种基于多组学数据整合的药物敏感性分类方法,其特征在于,包括:通过对细胞系测序获取多组学数据样本并构成多个组学矩阵;使用联合非负矩阵分解对所述多个组学矩阵进行分解,并通过构建多组学数据样本的结构相似性为矩阵分解加入图正则化,得到多组学数据样本的线性整合特征;使用变分自编码器得到多组学数据样本的非线性整合特征;拼接所述多组学数据样本的线性整合特征和非线性整合特征以及药物特征,得到拼接后特征向量;利用所述拼接后特征向量训练药物敏感性分类器;采用训练好的药物敏感性分类器进行药物敏感性分类,得到分类结果。2.根据权利要求1所述的基于多组学数据整合的药物敏感性分类方法,其特征在于,所述通过对细胞系测序获取多组学数据样本并构成多个组学矩阵,具体包括:通过对细胞系测序获取多组学数据样本1≤i≤M;M为获取的多组学数据样本数量;为组成多组学数据样本x
i
的第k个组学数据,1≤k≤K;K为多组学数据样本x
i
中包括的组学数据的数量;所述组学数据包括基因表达和DNA甲基化;将获取的M个多组学数据样本构成K个组学矩阵X={X
(1)
,

,X
(K)
};其中第k个组学矩阵3.根据权利要求2所述的基于多组学数据整合的药物敏感性分类方法,其特征在于,所述使用联合非负矩阵分解对所述多个组学矩阵进行分解,并通过构建多组学数据样本的结构相似性为矩阵分解加入图正则化,得到多组学数据样本的线性整合特征,具体包括:使用联合非负矩阵分解将所述K个组学矩阵X={X
(1)
,

,X
(K)
}分解为一个共享矩阵U和K个变换矩阵V
(1)
,

,V
(K)
,分解过程中通过构建多组学数据样本的结构相似性为矩阵分解加入图正则化,将分解得到的共享矩阵U的行向量u
i
作为多组学数据样本x
i
的线性整合特征。4.根据权利要求3所述的基于多组学数据整合的药物敏感性分类方法,其特征在于,所述使用变分自编码器得到多组学数据样本的非线性整合特征,具体包括:使用变分自编码器的编码器f
encoder
,...

【专利技术属性】
技术研发人员:张仲楠郑林义
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1