一种双向同源比对的非模式物种细胞注释方法技术

技术编号:35012348 阅读:28 留言:0更新日期:2022-09-21 15:07
本发明专利技术公开了一种双向同源比对的非模式物种细胞注释方法,属于细胞注释技术领域,主要包括以下步骤:将非模式物种的基因组和模式物种的基因组进行双向同源比对,保留在两个方向上都配对一致的基因对;在模式物种的标记基因数据库中,将双向同源比对的基因对中的非模式物种的基因替代双向同源比对的基因对中与非模式物种同源的基因,得到非模式物种的表达量矩阵;通过软件调用非模式物种的表达量矩阵的基因数据进行注释,得到非模式物种细胞类型的注释结果。采用该双向同源比对的非模式物种细胞注释方法,可以精确对非模式物种的基因进行同源比对,得到与模式物种同源的基因,利用模式物种的标记基因数据库实现对非模式物种的细胞注释。的细胞注释。的细胞注释。

【技术实现步骤摘要】
一种双向同源比对的非模式物种细胞注释方法


[0001]本专利技术属于细胞注释
,具体涉及一种双向同源比对的非模式物种细胞注释方法。

技术介绍

[0002]单细胞转录组的细胞注释分析是很依赖数据库的分析内容,前者是赋予数据生物学意义的重要基础,单细胞转录组通过对每个细胞的mRNA添加识别标签,从而实现将reads归属到其来源细胞,获取单细胞的基因表达丰度。但是,在这个过程中,我们仅能得到细胞的基因表达量,而无法知道这个细胞属于什么细胞类型,为了破除这种隔离,常用的方法是通过细胞表达细胞类型相关标记基因的情况来赋予细胞具有生物学意义的细胞类型标签,以便在后续分析中基于细胞类型讨论样本的分子特性。然而,非模式物种缺乏系统的标记基因研究,标记基因获取难度大,从而缺乏细胞表达细胞类型相关标记基因的情况的研究,因而,成为非模式物种细胞注释的主要阻碍。
[0003]标记基因作为细胞类型识别的重要指标,在许多文章都被证明了其具有保守性,例如,Cell杂志上报道了狨猴与人、小鼠视网膜标记基因的同源性(Peng Y R,Shekhar K,Yan W,et al.Molecular classification and comparative taxonomics of foveal and peripheral cells in primate retina[J].Cell,2019,176(5):1222

1237.e22.),也报道了肝细胞的标记基因在人、小鼠、猕猴、猪、仓鼠、鸡、斑马鱼的同源性(Guilliams M,Bonnardel J,Haest B,et al.Spatial proteogenomics reveals distinct and evolutionarily conserved hepatic macrophage niches[J].Cell,2022,185(2):379

396.e38.),Science杂志上报道了屏状核的标记基因在人、小鼠、海龟、鬃狮蜥的同源性(Norimoto H,Fenk L A,Li H H,et al.A claustrum in reptiles and its role in slow

wave sleep[J].Science,2020,578(7795):413

418.)。
[0004]以上报道提示了通过同源比对,借鉴成熟的模式物种的标记基因数据库,可以摆脱非模式物种目前缺乏系统的标记基因研究,对于细胞类型的标记基因在单细胞数据中的分布情况相关信息的依赖,有利于实现非模式物种单细胞研究从0到1的突破,但是,现有使用的同源比对方法都是单向比对,即将待分析物种的基因比对到模式物种的基因(例如小鼠),这种比对方法容易产生一个基因存在多个同源基因或假阳性同源基因的情况,对数据分析结果产生干扰,从而影响结果的正确性。

技术实现思路

[0005]为了克服现有技术中的上述不足,本专利技术的目的在于提供一种双向同源比对的非模式物种细胞注释方法,可以精确对非模式物种的基因进行同源比对,得到与模式物种同源的基因,利用与模式物种数据库同源的基因来完成相关分析,实现对非模式物种的细胞注释。
[0006]为了实现上述目的,本专利技术采用以下技术方案:
[0007]本专利技术提供一种双向同源比对的非模式物种细胞注释方法,包括以下步骤:
[0008]S1、对非模式物种进行单细胞转录组测序,得到单细胞转录组测序的数据;
[0009]S2、将非模式物种的基因组和模式物种的基因组进行比对,保留唯一比对上的基因对;
[0010]S3、将模式物种的基因组和非模式物种的基因组进行比对,保留唯一比对上的基因对;
[0011]S4、将所述S2中保留的唯一比对上的基因对和所述S3中保留的唯一比对上的基因对进行比较,保留相同的基因对,作为双向同源比对的基因对;
[0012]S5、在模式物种的标记基因数据库中,将所述双向同源比对的基因对中的非模式物种的基因替代所述双向同源比对的基因对中与非模式物种同源的基因,得到非模式物种的表达量矩阵;
[0013]S6、通过软件调用所述非模式物种的表达量矩阵的基因数据进行注释,得到非模式物种细胞类型的注释结果。
[0014]进一步地,所述S2和所述S3中,采用blast方法将模式物种的基因组和非模式物种的基因组进行比对。
[0015]进一步地,所述S5中,所述模式物种的标记基因数据库中包括模式物种的表达量矩阵,在所述模式物种的表达量矩阵中,将双向同源比对的基因对的模式物种的基因ID替换为所述双向同源比对的基因对中与模式物种同源的基因,得到所述非模式物种的表达量矩阵。
[0016]进一步地,采用singleR软件调用所述非模式物种的表达量矩阵的基因数据进行注释,得到所述非模式物种细胞类型的注释结果。
[0017]进一步地,在得到所述非模式物种细胞类型的注释结果后,利用模式物种的配体

受体数据库,根据得到的非模式物种细胞类型的注释结果,可以基于注释的所述非模式物种细胞类型对非模式物种细胞间进行细胞通讯分析。
[0018]进一步地,在得到所述非模式物种细胞类型的注释结果后,将所述非模式物种细胞类型的注释结果按照细胞类型进行统计,通过表格对非模式物种细胞类型的分布进行可视化。
[0019]进一步地,所述模式物种的标记基因数据库包括人的标记基因数据库和小鼠的标记基因数据库。
[0020]与现有技术相比,本专利技术提供的一种双向同源比对的非模式物种细胞注释方法具有的有益效果如下:
[0021]可以精确对非模式物种的基因进行同源比对,得到与模式物种同源的基因,保证了后续数据分析结果的准确性,根据得到的与模式物种同源的基因,采用软件调用模式物种的标记基因数据库的基因数据进行注释,实现对非模式物种的细胞类型注释,一方面完善了非模式物种的细胞类型解析,从而建立属于非模式物种细胞本身的标记基因体系,另一方面将模式物种的配体

受体数据库应用到非模式物种的细胞通讯分析中,使非模式物种的细胞通讯分析成为可能,实现从0到1的突破。
附图说明
[0022]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是实施例1提供的双向同源比对的非模式物种细胞注释方法的流程示意图。
[0024]图2是实施例2提供的大鼠的细胞人工注释的t

SNE图。
[0025]图3是实施例2提供的大鼠的基因组blast双向同源比对到小鼠的t

SNE图。
[0026]图4是实施例2提供的大鼠的基因组ensemb本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种双向同源比对的非模式物种细胞注释方法,其特征在于,包括以下步骤:S1、对非模式物种进行单细胞转录组测序,得到单细胞转录组测序的数据;S2、将非模式物种的基因组和模式物种的基因组进行比对,保留唯一比对上的基因对;S3、将模式物种的基因组和非模式物种的基因组进行比对,保留唯一比对上的基因对;S4、将所述S2中保留的唯一比对上的基因对和所述S3中保留的唯一比对上的基因对进行比较,保留相同的基因对,作为双向同源比对的基因对;S5、在模式物种的标记基因数据库中,将所述双向同源比对的基因对中的非模式物种的基因替代所述双向同源比对的基因对中与非模式物种同源的基因,得到非模式物种的表达量矩阵;S6、通过软件调用所述非模式物种的表达量矩阵的基因数据进行注释,得到非模式物种细胞类型的注释结果。2.根据权利要求1所述的一种双向同源比对的非模式物种细胞注释方法,其特征在于,所述S2和所述S3中,采用blast方法将模式物种的基因组和非模式物种的基因组进行比对。3.根据权利要求1所述的一种双向同源比对的非模式物种细胞注释方法,其特征在于,所述S5中,所述模式物种的标记基因数据库中包括模式物种的表达量矩阵,在所述模式物种的表达量...

【专利技术属性】
技术研发人员:周煌凯高川艾鹏张从曦孙鹏鹏
申请(专利权)人:广州基迪奥生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1