基于单细胞转录组数据的药物响应细胞群排序方法及系统技术方案

技术编号:39597711 阅读:12 留言:0更新日期:2023-12-03 19:56
本发明专利技术提供了一种基于单细胞转录组数据的药物响应细胞群排序方法及系统,涉及药物响应细胞群排序领域,该方法包括:根据已知细胞群类型的疾病状态下的

【技术实现步骤摘要】
基于单细胞转录组数据的药物响应细胞群排序方法及系统


[0001]本专利技术涉及药物响应细胞群排序领域,特别是涉及一种基于单细胞转录组数据的药物响应细胞群排序方法及系统


技术介绍

[0002]单细胞转录组测序
(single

cell RNA

seq

scRNA

seq)
技术实现了在每个单细胞中对所有基因表达的测定,已被广泛用于研究细胞的异质性

考虑到细胞对药物的响应存在高度异质性,利用
scRNA

seq
数据确定对药物扰动最敏感的细胞群对于理解药物作用机制和指导药物开发至关重要,已被广泛关注

目前,最常规的做法是利用不同条件下配对细胞群之间的差异表达基因数
(differentially expressed genes

DEGs)
来对药物响应细胞群进行打分和排序

近期,一些研究人员也提出了一种名为
Augur
的方法对细胞群进行扰动评分及排序

该方法利用高维空间中同一细胞群在不同条件下的可分离性来优先考虑对生物学干扰最敏感的细胞类型

然而,药物通常依赖于与靶蛋白的结合来发挥治疗效果

显然,这些方法未考虑药物靶标的先验知识,导致对药物响应细胞群的推断不够准确

此外,现有的策略和方法都需要两种不同状态下的
scRNA

seq
数据,严重限制了其在仅有疾病状态的
scRNA

seq
数据中的应用

截至目前,还没有只利用疾病状态下的
scRNA

seq
数据预测药物响应细胞群的方法


技术实现思路

[0003]本专利技术的目的是提供一种基于单细胞转录组数据的药物响应细胞群排序方法,以解决对药物响应细胞群的推断准确度低的问题

[0004]为实现上述目的,本专利技术提供了如下方案:
[0005]一种基于单细胞转录组数据的药物响应细胞群排序方法,包括:
[0006]获取已知细胞群类型的疾病状态
scRNA

seq
数据以及药物靶点信息;
[0007]根据所述
scRNA

seq
数据,利用基因的共表达关系构建每种细胞群的靶点基因调控网络
GRN

[0008]根据所述药物靶点信息虚拟敲除掉所述
GRN
中的靶点,构建每种所述细胞群虚拟敲除靶点后的靶点基因调控网络
tpGRN

[0009]通过流形对齐训练所述
GRN
中每个网络节点在所述
GRN
以及所述
tpGRN
中的低维表示;所述网络节点为基因节点;
[0010]基于所述低维表示,通过欧式距离计算每个所述网络节点在所述
GRN
以及所述
tpGRN
中的距离;
[0011]基于所述距离,综合考虑所述
GRN
以及所述
tpGRN
中药物靶点
、2

hop
节点以及所述2‑
hop
节点的边的变化趋势对不同细胞群的药物响应进行打分,生成药物扰动分数;
[0012]按照所述药物扰动分数对细胞群的药物响应进行排序,确定药物响应细胞群排序结果;所述药物响应细胞群排序结果用于表征所述细胞群对药物扰动后的响应程度

[0013]可选的,根据所述
scRNA

seq
数据,利用基因的共表达关系构建每种细胞群的靶点基因调控网络
GRN
,具体包括:
[0014]根据所述
scRNA

seq
数据构建
scRNA

seq
表达矩阵;
[0015]从所述
scRNA

seq
表达矩阵中每个细胞类型中随机选取
δ
c
细胞,提取出所选取
δ
c
个细胞对应的基因表达矩阵,并重复
S
次;其中,
δ
为选择比率,
c
为细胞个数;
[0016]对所述基因表达矩阵中的基因进行特征选择,构建
GRN
的基因集;所述基因集包括所述
scRNA

seq
数据中前
2000
个高变异基因
、AnimalTFDB
数据库中转录因子对应的基因以及
DGIdb
数据库中药物的靶基因;
[0017]利用主成分分析法确定所述基因集中每个基因的低维表示并估计基因间的回归系数作为所述
GRN
中边的权重;
[0018]定义任一基因表达矩阵,利用主成分分析法在多个潜在协变上对目标基因进行回归,构建目标基因与调控基因之间的关系;
[0019]根据目标基因与调控基因之间的关系以及所述权重构建基因邻接矩阵;
[0020]采用张量分量分析法将多个基因邻接矩阵组合成一个
S
×
T
×
R
的三阶张量
χ
;其中,
S

GRN
的数量,
T
为目标基因的数量,
R
为调控基因的数量;
[0021]提取多个所述
GRN
共享的主要特征模式,对所述三阶张量
χ
进行分解和逼近,生成新的三阶张量;
[0022]基于所述新的三阶张量,将每个所述权重除以所有权重绝对值中的最大绝对值进行归一化处理,构建每种细胞群的最终邻接矩阵;所述最终邻接矩阵为靶点基因调控网络
GRN。
[0023]可选的,所述目标基因与调控基因之间的关系为:
[0024]Y

X

β

+
ε

[0025]其中,
Y
为目标基因的表达向量;
X

为排名靠前的多个主成分对应的调控基因的表达向量;
β

为转化后潜在协变量的回归系数;
ε
为随机误差

[0026]可选的,提取多个所述
GRN
共享的主要特征模式,对所述三阶张量
χ
进行分解和逼近,生成新的三阶张量,具体包括:
[0027]提取多个所述...

【技术保护点】

【技术特征摘要】
1.
一种基于单细胞转录组数据的药物响应细胞群排序方法,其特征在于,包括:获取已知细胞群类型的疾病状态下的
scRNA

seq
数据以及药物靶点信息;根据所述
scRNA

seq
数据,利用基因的共表达关系构建每种细胞群的靶点基因调控网络
GRN
;根据所述药物靶点信息虚拟敲除掉所述
GRN
中的靶点,构建每种所述细胞群虚拟敲除靶点后的靶点基因调控网络
tpGRN
;通过流形对齐训练所述
GRN
中每个网络节点在所述
GRN
以及所述
tpGRN
中的低维表示;所述网络节点为基因节点;基于所述低维表示,通过欧式距离计算每个所述网络节点在所述
GRN
以及所述
tpGRN
中的距离;基于所述距离,综合考虑所述
GRN
以及所述
tpGRN
中药物靶点
、2

hop
节点以及所述2‑
hop
节点的边的变化趋势对不同细胞群的药物响应进行打分,生成药物扰动分数;按照所述药物扰动分数对细胞群的药物响应进行排序,确定药物响应细胞群排序结果;所述药物响应细胞群排序结果用于表征所述细胞群对药物扰动后的响应程度
。2.
根据权利要求1所述的基于单细胞转录组数据的药物响应细胞群排序方法,其特征在于,根据所述
scRNA

seq
数据,利用基因的共表达关系构建每种细胞群的靶点基因调控网络
GRN
,具体包括:根据所述
scRNA

seq
数据构建
scRNA

seq
表达矩阵;从所述
scRNA

seq
表达矩阵中每个细胞类型中随机选取
δ
c
细胞,提取出所选取
δ
c
个细胞对应的基因表达矩阵,并重复
S
次;其中,
δ
为选择比率,
c
为细胞个数;对所述基因表达矩阵中的基因进行特征选择,构建
GRN
的基因集;所述基因集包括所述
scRNA

seq
数据中前
2000
个高变异基因
、AnimalTFDB
数据库中转录因子对应的基因以及
DGIdb
数据库中药物的靶基因;利用主成分分析法确定所述基因集中每个基因的低维表示并估计基因间的回归系数作为所述
GRN
中边的权重;定义任一基因表达矩阵,利用主成分分析法在多个潜在协变上对目标基因进行回归,构建目标基因与调控基因之间的关系;根据目标基因与调控基因之间的关系以及所述权重构建基因邻接矩阵;采用张量分量分析法将多个基因邻接矩阵组合成一个
S
×
T
×
R
的三阶张量
χ
;其中,
S

GRN
的数量,
T
为目标基因的数量,
R
为调控基因的数量;提取多个所述
GRN
共享的主要特征模式,对所述三阶张量
χ
进行分解和逼近,生成新的三阶张量;基于所述新的三阶张量,将每个所述权重除以所有权重绝对值中的最大绝对值进行归一化处理,构建每种细胞群的最终邻接矩阵;所述最终邻接矩阵为靶点基因调控网络
GRN。3.
根据权利要求2所述的基于单细胞转录组数据的药物响应细胞群排序方法,其特征在于,所述目标基因与调控基因之间的关系为:
Y

X

β

+
ε
;其中,
Y
为目标基因的表达向量;
X'
为排名靠前的多个主成分对应的调控基因的表达向量;
β
'
为转化后潜在协变量的回归系数;
ε
为随机误差

4.
根据权利要求2所述的基于单细胞转录组数据的药物响应细胞群排序方法,其特征在于,提取多个所述
GRN
共享的主要特征模式,对所述三阶张量
χ
进行分解和逼近,生成新的三阶张量,具体包括:提取多个所述
GRN
共享的主要特征模式,利用公式共享的主要特征模式,利用公式对所述三阶张量
χ
进行分解和逼近;其中,
s
r
为在<...

【专利技术属性】
技术研发人员:范骁辉邵鑫李承宇廖杰
申请(专利权)人:浙江大学长三角智慧绿洲创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1