基于单细胞图熵检测复杂生物系统相变临界点的方法技术方案

技术编号:35003212 阅读:17 留言:0更新日期:2022-09-21 14:53
本发明专利技术公开了一种基于单细胞图熵检测复杂生物系统相变临界点的方法,该方法从单细胞特异性网络的角度出发,把稀疏的基因表达矩阵转换为非稀疏的图熵矩阵,然后基于图熵矩阵量化临界转变前阶段和临界阶段之间的不同动态特性,从而探测临界状态或相变的早期预警信号。为了验证检测方法的有效性,本发明专利技术将该检测方法应用于五个真实早期胚胎发育的单细胞转录组数据集,它们分别是:小鼠胚胎成纤维细胞被诱导分化为神经细胞的数据、神经祖细胞分化为神经细胞的数据、人胚胎干细胞分化为内胚层细胞的数据、小鼠成肝细胞分化为肝细胞和胆管细胞的数据、小鼠胚胎干细胞分化为中胚层祖细胞的数据。细胞的数据。细胞的数据。

【技术实现步骤摘要】
基于单细胞图熵检测复杂生物系统相变临界点的方法


[0001]本专利技术涉及生物系统
,具体涉及一种基于单细胞图熵检测复杂生物系统相变临界点的方法。

技术介绍

[0002]生物系统的动态发展过程通常可以被看作是一个非线性动力学系统的演化,具有三个阶段,即临界转变前阶段、临界阶段和临界转变后阶段,其中临界阶段是临界转变前阶段进入临界转变后阶段的临界点。传统的生物标记物旨在根据特定分子的表达量或分子产物的含量高低来区分相对临界转变前阶段和临界转变后阶段,但是由于临界转变前阶段和临界阶段之间通常没有显著差异,所以可能无法检测到复杂生物系统相变的临界。因此,对临界阶段的早期预警信号进行探测是一个挑战,这实际上意味着对复杂生物系统相变临界点进行预测。该计算方法的理论推导如下:
[0003]用非线性离散时间动态系统来表示:Z(t)=f(Z(t

1);P)来刻画复杂生物系统动态的演化过程,其中,Z(t)=(z1(t),z2(t),

,z
n
(t))是一个R
n
的向量,它表示系统在时间点t处内部变量的值;P=(p1,p2,

,p
s
)是一个代表缓慢变化因素的参数向量或者驱动因素,例如,遗传因素(SNP,CNV等),表观遗传因素(methylation,acetylation等)或者环境因素。f:R
n
×
R
s
×
R
n
是一个非线性函数。假设该动力系统满足以下三个条件:
[0004](i)是方程(1

2)的不动点,即
[0005](ii)存在调控参数P0,使得在不动点处有一个或者成对模为1的特征值;
[0006](iii)方程(1

2)在P≠P0处不总是存在模为1的特征值。
[0007]对于这样一个非线性系统,该系统在处将经历一个临界相变或者是一种当参数P达到阈值P
c
时的分岔(Gilmore,1993)。当P到达P
c
之前,系统应该保持稳定的平衡,因而所有的特征值的绝对值都在(0,1)内。使系统状态发生变化的参数值P
c
称为一个分岔参数值或一个临界值,而在这种分岔之前的阶段被称为临界转变之前阶段。在小噪声的理想情况下,当一个复杂生物系统接近临界阶段时,在所有观测变量中,系统内部存在一个被定义为动态网络生物标记物的优势群,这群分子基于观测数据满足以下三个条件(Chen et al.,2012;Liu et al.,2012):
[0008]1.这群变量中的每一个分子的方差迅速增大;
[0009]2.这群变量内部之间的皮尔逊相关系数迅速增大;
[0010]3.这群变量中的每一个分子与外部分子的皮尔逊相关系数迅速减少。
[0011]从动态网络生物标志物的性质来看,一个系统的临界状态转变实际上可以由一组网络水平上高度相关且波动剧烈的分子来表示。具体来说,当系统接近临界状态时,动态网络生物标志物表现出明显的集体波动行为,故它们在临界阶段下的相关性明显不同于临界转变前阶段。对于由动态网络生物标志物构成的子网络,当系统接近临界状态时,其网络结
构发生明显变化,表明即将到来的临界阶段。因此,通过在网络层面上探索这组主导分子的动态信息,可以预测定性状态变化。
[0012]大多数生物分子通过与功能模块或模块之间的其它生物分子的相互作用来执行其功能。这种模块间和模块内的互连性表明,特定遗传异常的影响不仅影响携带它的基因产物的活性,而且可以沿着由生物分子组成的网络的链接延伸,改变其它基因产物的活性。因此,了解生物分子的相互作用网络环境对于确定影响生物分子的缺陷的表型至关重要。

技术实现思路

[0013]本专利技术的目的是通过从单细胞水平上探索不同群体细胞之间的动态差异信息,提出一种基于单细胞图熵检测复杂生物系统相变临界点的方法。该方法能够定量表征细胞群体间基因调控网络的稳定性和临界性,是一种分析单细胞转录组数据的新颖方法,有助于从网络熵的角度追踪生物系统的动态发展,在具有稀疏特性的单细胞转录数据条件下也可以识别临界阶段。
[0014]本专利技术的目的可以通过采取如下技术方案达到:
[0015]一种基于单细胞图熵检测复杂生物系统相变临界点的方法,所述方法包括如下步骤:
[0016]S1、构建统计关联性指数过程如下:
[0017]S11、对于规范化后的基因表达矩阵,任意取基因对(gi,g
j
)在平面直角坐标系中绘制散点图,其中垂直轴和水平轴分别代表这两个基因的表达值,图中的每个点代表一个细胞,对于细胞C
k
,水平坐标为(基因gi在细胞C
k
中的表达值),垂直坐标为(基因g
j
在细胞C
k
中的表达值),水平坐标为基因g
i
在细胞C
k
中的表达值,垂直坐标为为基因g
j
在细胞C
k
中的表达值;
[0018]S12、在基因对(g
i
,g
j
)的散点图中,对于细胞C
k
,基于两个预设的参数n
(k)
(E
i
)=0.1N和n
(k)
(E
j
)=0.1N(N代表数据矩阵中的细胞数目)分别在基因表达值和附近设置条框,其中n
(k)
(E
i
)代表附近的细胞数,n
(k)
(E
j
)代表附近的细胞数;
[0019]S13、将两个条框的重叠部分中的细胞数标记为n
(k)
(E
i
,E
j
);
[0020]S14、基于三个统计量n
(k)
(E
i
)、n
(k)
(E
j
)和n
(k)
(E
i
,E
j
)构建统计关联性指数定义如下:
[0021][0022]S2、为每个细胞构建一个特异性网络,基于上述构建的统计关联性指数构造细胞C
k
的特异性网络,如果统计相关性指数大于0,即等式(A1)大于0,则代表在细胞C
k
中基因g
i
和g
j
之间存在连接边,否则不存在连接边,通过统计关联性指数判断任意两个基因之间在细胞C
k
是否存在连接边,遍历所有每一基因对后,构建细胞C
k
的特异性网络N
(k)

从细胞的特异性网络提取每个局部网络或子网络,每个基因都有一个对应的局部网络,该局部网络由一个中心节点基因和中心节点基因的一阶邻居所构成,把每个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于单细胞图熵检测复杂生物系统相变临界点的方法,其特征在于,所述方法包括如下步骤:S1、构建统计关联性指数过程如下:S11、对于规范化后的基因表达矩阵,任意取基因对(g
i
,g
j
)在平面直角坐标系中绘制散点图,散点图中垂直轴和水平轴分别代表这两个基因的表达值,散点图中的每个点代表一个细胞,对于细胞C
k
,水平坐标为,水平坐标为是基因g
i
在细胞C
k
中的表达值,垂直坐标为中的表达值,垂直坐标为是基因g
j
在细胞C
k
中的表达值,水平坐标为基因g
i
在细胞C
k
中的表达值,垂直坐标为为基因g
j
在细胞C
k
中的表达值;S12、在基因对(g
i
,g
j
)的散点图中,对于细胞C
k
,基于两个预设的参数n
(k)
(E
i
)=0.1N和n
(k)
(E
j
)=0.1N分别在基因表达值和附近设置条框,其中n
(k)
(E
i
)代表附近的细胞数,n
(k)
(E
j
)代表附近的细胞数,N代表数据矩阵中的细胞数目;S13、将两个条框的重叠部分中的细胞数标记为n
(k)
(E
i
,E
j
);S14、基于三个统计量n
(k)
(E
i
)、n
(k)
(E
j
)和n
(k)
(E
i
,E
j
)构建统计关联性指数定义如下:S2、为每个细胞构建一个特异性网络,基于上述构建的统计关联性指数构造细胞C
k
的特异性网络,如果统计相关性指数大于0,即等式(A1)大于0,则代表在细胞C
k
中基因g
i
和g
j
之间存在连接边,否则不存在连接边,通过统计关联性指数判断任意两个基因之间在细胞C
k
...

【专利技术属性】
技术研发人员:刘锐钟佳元
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1