System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及细胞转录组数据分析,尤其涉及一种溶血血液样本单细胞转录组数据分析方法、介质和设备。
技术介绍
1、基于微流控技术的单细胞转录组测序能够在单个实验中对数万个细胞的基因表达进行量化。其主要是基于两段序列标签来识别单个细胞和单条转录本,其中用来标记单个细胞的标签通常称为barcode(条形码),用来标记单条转录本的标签称为umi(uniquemolecular identifiers,唯一分子标识符)。正常情况下,同一个液滴只会被一个barcode,而同一液滴下的不同转录本会有不同umi,而一个捕获了细胞的barcode可能带有几百到上万个umi,umi数量取决于液滴中的转录本数量。转录本加上标签后,再经过反转录、pcr扩增、文库构建、测序等过程,即可获得可供分析的数据。
2、血液中包含大量红细胞,其在体外遇到低渗溶液、机械性强力振荡、突然低温冷冻(-20℃~—25℃)或突然化冻、过酸或过碱、酒精、乙醚、皂碱、胆碱盐等条件,均可能溶解,通常将红细胞溶解称为溶血。由于血液采集后到进行单细胞转录组实验这段过程往往不可控,常常出现溶血的情况。但溶血会导致血细胞的hbb和hba等血红蛋白基因大量游离到细胞血液中,而基因污染会占用正常细胞的测序量,导致应有的测序深度降低。而在多样本的分析中,测序深度会导致分析结果不准确,甚至出现偏离常理的结果。
3、当前对溶血样本的处理通常是直接进行分析,或者在分析获得单细胞的基因表达谱后,使用去除背景rna污染的软件进行处理。但当血液样本存在严重溶血时,去背景rna污染的
技术实现思路
1、为了解决
技术介绍
中提到的至少一个技术问题,本专利技术的目的在于提供一种溶血血液样本单细胞转录组数据分析方法、介质和设备,能够排除测序深度降低带来的影响,从而提高数据可靠性和分析准确性。
2、为实现上述目的,本专利技术提供如下技术方案:
3、第一方面,本专利技术提供一种溶血血液样本单细胞转录组数据分析方法,包括以下步骤:
4、将每一样本的原始测序数据比对到参考基因组上,统计用于标记单个细胞的第一标签、用于标记单条转录本的第二标签、每个第二标签比对上的基因以及每个第二标签被测序到的次数,生成比对信息表;
5、统计各样本的有效序列数,并以最低的有效序列数来矫正测序深度,重新生成所述比对信息表;
6、基于重新生成的比对信息表,去除重复序列,生成各样本的细胞表达谱;
7、合并各样本的细胞表达谱。
8、在本专利技术第一方面的某些实施例中,所述有效序列数的统计方法如下:
9、构建第二标签池,所述第二标签池包含比对信息表中的所有第二标签,且按照被测序到的次数生成相应重复数量的第二标签;所述第二标签池内所包含的第二标签的总数即为有效序列数。
10、在本专利技术第一方面的某些实施例中,以最低的有效序列数来矫正测序深度的方法如下:
11、比较各样本的有效序列数,取最小值作为最低的有效序列数;
12、在各样本的第二标签池中随机抽取数量等于最低的有效序列数的第二标签;
13、统计抽取出的第二标签,重新生成所述比对信息表。
14、在本专利技术第一方面的某些实施例中,生成各样本的细胞表达谱的方法如下:
15、统计各个第一标签的基因和各个基因对应的第二标签的数量,并将所述各个基因对应的第二标签的数量作为该基因的表达量;
16、整理为行为基因,列为第一标签的表达量表格,即为所述细胞表达谱。
17、在本专利技术第一方面的某些实施例中,在统计各样本的有效序列数之前,还包括去除低质量细胞和血红蛋白基因的步骤。
18、在本专利技术第一方面的某些实施例中,去除低质量细胞的方法如下:
19、统计每个第一标签对应的基因种类,将基因种类的数量低于设定第一阈值的第一标签判定为低质量细胞液滴;并将该第一标签的数据从比对信息表中删除。
20、在本专利技术第一方面的某些实施例中,所述第一阈值为500。
21、第二方面,本专利技术提供一种溶血血液样本单细胞转录组数据分析系统,包括:
22、比对信息模块,将每一样本的原始测序数据比对到参考基因组上,统计用于标记单个细胞的第一标签、用于标记单条转录本的第二标签、每个第二标签比对上的基因以及每个第二标签被测序到的次数,生成比对信息表;
23、矫正模块,统计各样本的有效序列数,并以最低的有效序列数来矫正测序深度,重新生成所述比对信息表;
24、去重模块,基于重新生成的比对信息表,去除重复序列,生成各样本的细胞表达谱;
25、合并模块,合并各样本的细胞表达谱。
26、在本专利技术第二方面的某些实施例中,还包括筛选模块,在统计各样本的有效序列数之前,去除低质量细胞和/或血红蛋白基因。
27、第三方面,本专利技术提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的溶血血液样本单细胞转录组数据分析方法。
28、第四方面,本专利技术提供一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如第一方面所述的溶血血液样本单细胞转录组数据分析方法。
29、与现有技术相比,本专利技术的有益效果是:
30、本专利技术通过矫正有效测序数,可使各样本获得较为一致的测序深度,从而减少溶血导致测序深度降低的影响。与现有技术相比,本专利技术提供的技术方案明晰了溶血样本单细胞转录组数据分析方法,提高了数据的可靠性,减少了溶血导致的结果偏差。
本文档来自技高网...【技术保护点】
1.一种溶血血液样本单细胞转录组数据分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,所述有效序列数的统计方法如下:
3.根据权利要求2所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,以最低的有效序列数来矫正测序深度的方法如下:
4.根据权利要求1所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,生成各样本的细胞表达谱的方法如下:
5.根据权利要求1所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,在统计各样本的有效序列数之前,还包括去除低质量细胞和血红蛋白基因的步骤。
6.根据权利要求5所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,去除低质量细胞的方法如下:
7.根据权利要求6所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,所述第一阈值为500。
8.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7任意一项所述的溶血血液样本单细
9.一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述的溶血血液样本单细胞转录组数据分析方法。
...【技术特征摘要】
1.一种溶血血液样本单细胞转录组数据分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,所述有效序列数的统计方法如下:
3.根据权利要求2所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,以最低的有效序列数来矫正测序深度的方法如下:
4.根据权利要求1所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,生成各样本的细胞表达谱的方法如下:
5.根据权利要求1所述的一种溶血血液样本单细胞转录组数据分析方法,其特征在于,在统计各样本的有效序列数之前,还包括去除低质量细胞和血红蛋白基因的步骤。...
【专利技术属性】
技术研发人员:陈哲名,葛长利,李浩,叶祯皓,
申请(专利权)人:杭州联川生物技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。