System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 癌症跨组织免疫细胞类型富集和表达图谱的分析系统及检索方法技术方案_技高网

癌症跨组织免疫细胞类型富集和表达图谱的分析系统及检索方法技术方案

技术编号:40837265 阅读:2 留言:0更新日期:2024-04-01 15:02
本发明专利技术公开了一种癌症跨组织免疫细胞类型富集和表达图谱的分析系统及检索方法,系统包括富集分析模块和表达分析模块;富集分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的自定义基因以获得癌症跨组织免疫细胞类型或富集状态;表达分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的基因信息,全面分析跨多个组织绘制的免疫细胞特征,包括表达图谱、相关性、相似基因检测、特征评分和表达值比较;标记基因是根据NCBI和公开文献中收集的癌症跨组织单细胞RNA‑seq数据得到的。本发明专利技术实现了癌症跨组织免疫细胞类型和表达图谱等全方位的一站式的在线计算和信息检索,大大提高了单细胞数据使用的便利性。

【技术实现步骤摘要】

本专利技术涉及基因数据库的,特别是涉及一种癌症跨组织免疫细胞类型富集和表达图谱的分析系统及检索方法


技术介绍

1、单细胞rna测序技术(single-cell rna sequencing,scrna-seq)使用优化的新一代测序技术检测单个细胞的转录组,提供精度更高的基因表达分辨率,并更好地了解单个细胞在其微环境中的功能。在过去十年中,单细胞转录组研究呈指数增长,涵盖了广泛的组织类型和疾病,尤其在癌症研究领域,scrna-seq技术已成为研究肿瘤微环境、癌症发病机制、转移与侵袭以及各类癌症治疗与诊断不可或缺的手段。大规模癌症scrna-seq数据的积累对数据管理和规范处理提出了更高的要求。

2、最近,癌症的跨组织单细胞研究揭示了以前未被重视的免疫细胞类型或状态的异质性,这反映在它们的标记基因组中表达。例如,来自外周血、原发性和转移性肿瘤的免疫细胞和癌症患者的邻近正常组织表现出不同的分子和功能特性。因此,迫切需要深入的数据集成和网络服务器来表征癌症免疫细胞映射到多个组织,并反过来评估特定环境的细胞,丰富自定义基因集的类型或状态。

3、当前已发表的单细胞测序数据,主要以原始数据或者表达谱的形式存储在综合门户网站,如ncbi geo、ngdc gsa数据库等。由于处理单细胞数据需要使用复杂的计算流程和大型的集群服务器,研究人员很难访问并使用这些数据。已发表的单细胞测序相关二级数据库尝试采用标准化流程整合和预处理数据,实现用户易于访问的目的。如文献(franzeno.,gan l.m.,bjorkegren j.l.m.et al.panglaodb:a web server for exploration ofmouse and human single-cell rna sequencing data.database(oxford).2019;2019:baz046;.papatheodorou i.,moreno p.,manning j.et al.expression atlas update:from tissues to single cells.nucleic acids res.2020;48:d77-d83;lindeboomr.g.h.,regev a.,teichmann s.a..towards a human cell atlas:taking notes fromthe past.trends genet.2021;37:625-630;cao y.,zhu j.,jia p.et al.scrnaseqdb:adatabase for rna-seq based gene expression profiles in human singlecells.genes.2017;8:368)公开的综合网站主要收集人类和/或小鼠样本,提供仅包含细胞聚类和差异基因表达谱的基本分析。其他疾病或癌症特异性数据库,如文献(sun d.,wangj.,han y.et al...tisch:a comprehensive web resource enabling interactivesingle-cell transcriptome visualization of tumor microenvironment.nucleicacids res.2021;49:d1420-d1430.),它所有下载的数据集都是固定的表达矩阵,并且没有统一的方法来进行reads质量控制和基因表达量化。这些问题可能会导致分析偏差或降低不同数据库之间的可比性;文献(yuan h,yan m,zhang g,et al.cancersea:a cancersingle-cell state atlas.nucleic acids res2019;47:d900-8.)公开的数据库仅包含41900个单细胞数据,且只提供癌症单细胞水平癌细胞功能状态的检索。文献(zeng j,zhang y,shang y,et al.cancerscem:a database of single-cell expression mapacross various human cancers.nucleic acids res2022;50:d1147-55.)公开的数据库虽然包含了大量的单细胞数据集,但仅提供单个样本的基因和样本的分析检索功能,没有实现多样本的整合分析功能。尽管已经有一些癌症相关的在线分析或检索平台已经被开发出来,但基于大规模的癌症跨组织的单细胞数据整合分析及癌症跨组织患者免疫细胞组织特异性特征的在线检索及分析功能目前尚未见报道。


技术实现思路

1、有鉴于此,本专利技术提供了一种癌症跨组织免疫细胞类型富集和表达图谱的分析系统及检索方法,可以为癌症跨组织免疫细胞类型富集和表达图谱查询提供便利的分析和检索。

2、本专利技术的第一个目的在于提供一种癌症跨组织免疫细胞类型富集和表达图谱的分析系统。

3、本专利技术的第二个目的在于提供一种癌症跨组织免疫细胞类型富集和表达图谱的分析和检索方法。

4、本专利技术的第一个目的可以通过采取如下技术方案达到:

5、一种癌症跨组织免疫细胞类型富集和表达图谱的分析系统,所述分析系统包括富集分析模块和表达分析模块;所述富集分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的自定义基因以获得癌症跨组织免疫细胞类型或富集状态;所述表达分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的基因信息,全面分析跨多个组织绘制的免疫细胞特征,包括表达图谱、相关性、相似基因检测、特征评分和表达值比较;

6、所述所有组织特异性细胞类型的标记基因通过如下方式获得:

7、从ncbi和公开文献中收集癌症跨组织单细胞rna-seq数据;对收集的癌症跨组织单细胞rna-seq数据进行数据处理,得到所有组织特异性细胞类型的标记基因。

8、进一步的,所述富集分析模块允许用户输入自定义的基因列表或基因列表文件,基于所有组织特异性细胞类型的标记基因通过富集算法计算匹配的细胞类型和状态,以实现跨组织免疫细胞类型和状态的富集分析。

9、进一步的,所述通过富集算法计算匹配的细胞类型和状态,包括:

10、根据所有组织特异性细胞类型的标记基因计算前景和背景基因集,再计算每种富集细胞类型的标记基因和非标记基因的数量;

11、然后进行统计分析,包括卡方检验或fisher精确检验,以确定富集的显著性并提供相应的p值。

12、进一步的,所述表达图谱允许用户使用umap图、小提琴图和/或点图描绘癌症特定组织类型中一个或多个基因的表达,输入参数包括:

13、输入基因:输入自定义的基因或基因列表,其中enter键拆分基因;

14、组织类型:选择原发性癌组织、原发性癌旁组织、转移癌组织、转移癌旁组织、淋巴结组织或外周血;

15、细胞类型注释:选择"主要细胞类型注释本文档来自技高网...

【技术保护点】

1.一种癌症跨组织免疫细胞类型富集和表达图谱的分析系统,其特征在于,所述分析系统包括富集分析模块和表达分析模块;所述富集分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的自定义基因以获得癌症跨组织免疫细胞类型或富集状态;所述表达分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的基因信息,全面分析跨多个组织绘制的免疫细胞特征,包括表达图谱、相关性、相似基因检测、特征评分和表达值比较;

2.根据权利要求1所述的分析系统,其特征在于,所述富集分析模块允许用户输入自定义的基因列表或基因列表文件,基于所有组织特异性细胞类型的标记基因通过富集算法计算匹配的细胞类型和状态,以实现跨组织免疫细胞类型和状态的富集分析。

3.根据权利要求2所述的分析系统,其特征在于,所述通过富集算法计算匹配的细胞类型和状态,包括:

4.根据权利要求1所述的分析系统,其特征在于,所述表达图谱允许用户使用umap图、小提琴图和/或点图描绘癌症特定组织类型中一个或多个基因的表达,输入参数包括:

5.根据权利要求1所述的分析系统,其特征在于,所述相关性分析允许用户计算癌症特定组织特定细胞类型中两个基因的相关性,输入参数包括:

6.根据权利要求1所述的分析系统,其特征在于,所述特征评分分析允许用户计算癌症特定组织中所有细胞类型自定义特征的得分及差异比较结果,输入参数包括:

7.根据权利要求1所述的分析系统,其特征在于,所述对收集的癌症跨组织单细胞RNA-seq数据进行数据处理,得到所有组织特异性细胞类型的标记基因,包括:

8.根据权利要求7所述的分析系统,其特征在于,所述批次效应采用Harmonys算法,通过调整细胞的表达模型,以使得不同批次之间的差异最小化,其中包括两个关键步骤:批次间对齐和去除批次效应;

9.根据权利要求1~8任一项所述的分析系统,其特征在于,所述收集的癌症跨组织单细胞RNA-seq数据包括百万级癌症多种组织类型单细胞数据,具体包括原发性癌组织和癌旁组织、转移癌组织和癌旁组织、淋巴结组织和外周血的几百个样本的单细胞RNA-Seq数据。

10.一种癌症跨组织免疫细胞类型富集和表达图谱的分析和检索方法,其特征在于,所述方法包括:

...

【技术特征摘要】

1.一种癌症跨组织免疫细胞类型富集和表达图谱的分析系统,其特征在于,所述分析系统包括富集分析模块和表达分析模块;所述富集分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的自定义基因以获得癌症跨组织免疫细胞类型或富集状态;所述表达分析模块用于基于所有组织特异性细胞类型的标记基因,根据用户输入的基因信息,全面分析跨多个组织绘制的免疫细胞特征,包括表达图谱、相关性、相似基因检测、特征评分和表达值比较;

2.根据权利要求1所述的分析系统,其特征在于,所述富集分析模块允许用户输入自定义的基因列表或基因列表文件,基于所有组织特异性细胞类型的标记基因通过富集算法计算匹配的细胞类型和状态,以实现跨组织免疫细胞类型和状态的富集分析。

3.根据权利要求2所述的分析系统,其特征在于,所述通过富集算法计算匹配的细胞类型和状态,包括:

4.根据权利要求1所述的分析系统,其特征在于,所述表达图谱允许用户使用umap图、小提琴图和/或点图描绘癌症特定组织类型中一个或多个基因的表达,输入参数包括:

5.根据权利要求1所述的分析系统,其特征在...

【专利技术属性】
技术研发人员:申健何金花谢芳梅韩泽平罗文峰赵莹
申请(专利权)人:广州市番禺区中心医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1