System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于单细胞数据的细胞通讯预测方法技术_技高网

一种基于单细胞数据的细胞通讯预测方法技术

技术编号:40512283 阅读:9 留言:0更新日期:2024-03-01 13:28
本发明专利技术的一种基于单细胞数据的细胞通讯预测方法,包括以下步骤:S1,构建基因调控网络,选取一单细胞基因表达矩阵数据A<subgt;m×n</subgt;,利用该单细胞基因表达数据计算不同基因之间的调控强度和调控方向,利用基因之间的调控关系构建基因调控网络,S2,构建细胞通讯网络:对单细胞基因表达矩阵数据分解得到单细胞表达数据对应的奇异值矩阵,基于该奇异值矩阵和步骤S1中获得的基因调控网络邻接矩阵,通过求解矩阵方程,得到细胞通讯网络邻接矩阵,构建细胞通讯网络。本发明专利技术的一种基于单细胞数据的细胞通讯预测方法,基于基因之间的调控关系推断细胞之间的调控关系,不局限于特定配受体对或信号通路,提供了一种无监督的、基于单细胞数据的细胞通讯预测方法。

【技术实现步骤摘要】

本专利技术属于系统生物信息学,具体涉及一种基于单细胞数据的细胞通讯预测方法


技术介绍

1、细胞通讯是指在多细胞生物的细胞社会中,细胞间或细胞内通过高度精确和高效地发送与接收信息的通讯机制。细胞通讯的方式有很多种,例如:化学物质的传递、电信号的传递、机械刺激等。

2、细胞通讯是多细胞生命产生、生存和完成生物任务的根本基础之一。例如,在多细胞生命体胚胎发育的过程中,细胞的分化、生长和最终命运决定是由与邻近细胞的通讯控制的;在发育成熟的多细胞生命体中,细胞通讯将参与协调复杂生命体内进行的多种细胞类型之间的活动,如免疫反应、组织生长和器官稳态调节等。随着高通量测序技术的发展,单细胞基因表达数据能够获取单细胞分辨率下的信息,极大程度的促进了细胞通讯的研究。基于单细胞数据的细胞通讯预测,是多细胞生命体的组织和器官发育研究、疾病研究、生物医学和生物治疗研究中常见的分析步骤,逐渐成为生物学、医学、神经科学、脑科学等各个自然科学领域的研究热点,对于揭示不同细胞的功能、探究疾病状态中的信号变化、推动生物医学的发展至关重要。

3、目前已有方法大多聚焦于配体和受体的表达,还有一些方法考虑了更多其他生物信号分子影响因素,以配受体等信号分子数据库收集为前提,从而预测细胞通讯是目前的主流研究思路。伴随着信号分子数据库的收集整理,一方面,信号分子数据库的收集整理是一项极具挑战性的任务,需要严格保证准确性和完整性,数据库建立后的更新和维护也需要大量的时间和精力;另一方面,现有信号分子的研究主要集中于人类,大多数现有方法只能针对人类物种推断细胞通讯,到目前为止,还没有有效的方法能够避免细胞通讯预测中的物种限制。

4、细胞和细胞之间的通讯关系可以描述为一个连接了所有单细胞的加权有向图,图中的每一个节点表示一个细胞,有向边的箭头表示细胞通讯的方向,有向边的权值表示细胞通讯的强度。现有的细胞通讯预测方法包括cellphonedb算法、italk算法和cellchat算法等,这些方法都以信号分子数据库为研究基础。具体地说,cellphonedb算法根据配受体基因的共表达情况判断细胞通讯强度,通过细胞群的标签排列检验来判断细胞通讯的显著性,用于探究人类妊娠早期蜕膜中胎盘形成期间发生的细胞通讯事件。italk算法根据不同细胞亚群中的基因平均表达量筛选基因,获取细胞群之间差异表达的基因列表,再结合人类配受体数据库,确定列表中具有显著作用的配受体对用于预测细胞间通讯。cellchat算法通过识别差异过表达的配受体,预测细胞通讯概率值,并广泛应用于人类和小鼠物种。然而,一方面,这些方法只能基于特定配受体对或特定信号通路下预测细胞通讯,这将导致最终的预测结果受到配体-受体等先验信息质量的影响,需要用到的先验信息越多,最终结果对先验信息的完整性和准确性越敏感。另一方面,由于现有信号分子数据库仅限于人类和小鼠物种,这还将导致算法的适用物种范围受到限制。此外,事实上,细胞通讯的生物学特征是单个细胞之间通过多个配受体对和多个通路相互作用的全局结果。然而,现有细胞通讯预测方法在细胞群的水平上进行推断,并基于单个特定配受体对或信号通路,这意味着现有算法的预测结果将局限在单个配受体对或信号通路中,是一种局部预测结果。

5、因此,在未知信号分子相互作用的情况下,在不依赖于生物先验信息的情况下,在单细胞水平上,预测不受物种限制的细胞通讯全局结果,从而更好地揭示细胞之间的相互作用关系,为实际研究工作提供更多的生物学见解,仍然是一项待解决的技术问题。


技术实现思路

1、本专利技术的目的在于,针对现有技术中的问题,提供一种无监督的、基于单细胞数据的细胞通讯预测方法。

2、为此,本专利技术的上述目的通过以下技术方案实现:

3、一种基于单细胞数据的细胞通讯预测方法,包括以下步骤:

4、s1,构建基因调控网络,选取一单细胞基因表达矩阵数据am×n,其中包含m个基因、n个细胞,利用该单细胞基因表达数据计算不同基因之间的调控强度和调控方向,利用基因之间的调控关系构建基因调控网络,基因调控网络表示成一个m行m列的邻接矩阵,其中,矩阵的第i行、第j列元素代表基因i与基因j之间的调控强度,其中,1≤i≤m,1≤j≤m;

5、s2,构建细胞通讯网络:对单细胞基因表达矩阵数据am×n进行奇异值分解,得到单细胞表达数据对应的奇异值矩阵,将其作为连接基因和细胞之间关系的中介矩阵,基于该中介矩阵和步骤s1中获得的基因调控网络邻接矩阵,通过求解矩阵方程,得到细胞通讯网络邻接矩阵,从而构建细胞通讯网络。在采用上述技术方案的同时,本专利技术还可以采用或者组合采用如下技术方案:

6、作为本专利技术的优选技术方案:采用gniplr算法评估基因之间的调控关系用于构建基因调控网络:首先构建基因之间的初始相关性网络,然后生成伪时间序列数据,最后引入滞后回归,从而获取不同基因之间的调控强度和调控方向。

7、作为本专利技术的优选技术方案:构建基因调控网络邻接矩阵包括以下步骤:首先进行基因分组,用g1,g2,…,gm表示单细胞基因表达矩阵中的m个基因,将这m个基因按照g1,g2,…,gm的顺序分成l组,每一组包含u个基因,u<m,l=m/u,若m/u不为整数,则将m/u向上取整作为l的终值;

8、然后,计算邻接矩阵的子矩阵,将m行m列的邻接矩阵rm×m分成l2个子矩阵,则邻接矩阵rm×m可以被表示为:

9、

10、其中,r′st为rm×m分成的l2个子矩阵中的某一子矩阵,每一个子矩阵r′st是一个u行u列的矩阵,其中,1≤s≤l,1≤t≤l,该矩阵表示包含在第s个基因组gs中的u个基因对包含在第t个基因组gt中的u个基因的调控;所有子矩阵使用gniplr算法的默认参数α=0.1计算,最后是整合l2个邻接子矩阵,得到完整的基因调控网络邻接矩阵rm×m。

11、作为本专利技术的优选技术方案:基于矩阵分解来构建细胞通讯网络:对单细胞基因表达矩阵am×n进行矩阵分解,得到3个子矩阵r,∑,w,具体算式如下:

12、a=r∑w

13、其中,左子矩阵r,m行m列,m表示单细胞基因表达矩阵a中的基因数量,用左子矩阵r表示m个基因之间的关系;右子矩阵w,n行n列,n表示单细胞基因表达矩阵a中的细胞数量;中间子矩阵∑,m行n列,是单细胞基因表达矩阵a的奇异值矩阵,中间子矩阵∑表示连接了基因和细胞之间关系的中介矩阵。

14、作为本专利技术的优选技术方案:中间子矩阵∑通过对单细胞基因表达矩阵a奇异值分解计算得到;左子矩阵r依据步骤s1计算矩阵a对应的基因调控网络邻接矩阵得到。

15、作为本专利技术的优选技术方案:细胞通讯网络邻接矩阵通过重新求解右子矩阵w得到,计算公式为:

16、w=(r∑)-1a。

17、作为本专利技术的优选技术方案:当m≠n时,矩阵r∑非方阵;或,非方阵矩阵r∑无法直接求解逆矩阵(r∑)-1时,

18、采用矩阵r∑的伪逆矩阵(本文档来自技高网...

【技术保护点】

1.一种基于单细胞数据的细胞通讯预测方法,包括以下步骤:

2.如权利要求1所述的基于单细胞数据的细胞通讯预测方法,其特征在于:采用GNIPLR算法评估基因之间的调控关系用于构建基因调控网络:首先构建基因之间的初始相关性网络,然后生成伪时间序列数据,最后引入滞后回归,从而获取不同基因之间的调控强度和调控方向。

3.如权利要求1所述的基于单细胞数据的细胞通讯预测方法,其特征在于:构建基因调控网络邻接矩阵包括以下步骤:首先进行基因分组,将m个基因按照g1,g2,…,gm的顺序分成l组,每一组包含u个基因,u<m,l=m/u,若m/u不为整数,则将m/u向上取整作为l的终值;

4.如权利要求1所述的基于单细胞数据的细胞通讯预测方法,其特征在于:基于矩阵分解来构建细胞通讯网络:对单细胞基因表达矩阵Am×n进行矩阵分解,得到3个子矩阵R,Σ,W,具体算式如下:

5.如权利要求4所述的基于单细胞数据的细胞通讯预测方法,其特征在于:中间子矩阵Σ通过对单细胞基因表达矩阵A奇异值分解计算得到;左子矩阵R依据步骤S1计算矩阵A对应的基因调控网络邻接矩阵得到。

6.如权利要求4所述的基于单细胞数据的细胞通讯预测方法,其特征在于:细胞通讯网络邻接矩阵通过重新求解右子矩阵W得到,计算公式为:W=(R∑)-1A。

7.如权利要求4所述的基于单细胞数据的细胞通讯预测方法,其特征在于:当m≠n时,矩阵R∑非方阵;或,非方阵矩阵R∑无法直接求解逆矩阵(R∑)-1时,

8.如权利要求7所述的基于单细胞数据的细胞通讯预测方法,其特征在于:右子矩阵W上的第i行、第j列元素用Wij表示,当i=j时,Wii或Wjj表示细胞i或细胞j的自分泌情况;当i≠j时,Wij表示细胞i和细胞j之间的旁分泌通讯,其中,Wij的正负情况表示细胞i和细胞j的通讯方向,Wij的绝对值大小|Wij|表示细胞i和细胞j的通讯强度。

9.如权利要求8所述的基于单细胞数据的细胞通讯预测方法,其特征在于:当Wij大于零时表示通讯信号由细胞i发出,被细胞j接收,当Wij小于零时表示通讯信号由细胞j发出,被细胞i接收。

...

【技术特征摘要】

1.一种基于单细胞数据的细胞通讯预测方法,包括以下步骤:

2.如权利要求1所述的基于单细胞数据的细胞通讯预测方法,其特征在于:采用gniplr算法评估基因之间的调控关系用于构建基因调控网络:首先构建基因之间的初始相关性网络,然后生成伪时间序列数据,最后引入滞后回归,从而获取不同基因之间的调控强度和调控方向。

3.如权利要求1所述的基于单细胞数据的细胞通讯预测方法,其特征在于:构建基因调控网络邻接矩阵包括以下步骤:首先进行基因分组,将m个基因按照g1,g2,…,gm的顺序分成l组,每一组包含u个基因,u<m,l=m/u,若m/u不为整数,则将m/u向上取整作为l的终值;

4.如权利要求1所述的基于单细胞数据的细胞通讯预测方法,其特征在于:基于矩阵分解来构建细胞通讯网络:对单细胞基因表达矩阵am×n进行矩阵分解,得到3个子矩阵r,σ,w,具体算式如下:

5.如权利要求4所述的基于单细胞数据的细胞通讯预测方法,其特征在于:中间子矩阵σ通过对单细胞基因表达矩阵a奇异值分解计算得到;...

【专利技术属性】
技术研发人员:刘小平刘怡常啸
申请(专利权)人:国科大杭州高等研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1