【技术实现步骤摘要】
一种单细胞转录组RNA污染去除方法、介质和设备
[0001]相关申请的交叉引用
[0002]本申请是基于申请号为2022113640956,申请日为:2022年11月02日,专利技术名称为:一种单细胞转录组RNA污染鉴定方法、介质和设备的分案申请。
[0003]本专利技术涉及生物数据分析方法,尤其涉及一种单细胞转录组RNA污染去除方法、介质和设备。
技术介绍
[0004]基于微流控技术的单细胞转录组测序能够在单个实验中对数万个细胞的基因表达进行量化。其主要是基于序列标签来识别单细胞,其核心技术是给每个细胞添加一个独特的序列标签,在测序时把携带相同标签的核酸序列视为来自同一个细胞。10X Genomics单细胞转录组测序平台为目前应用广泛的一种技术,该平台利用微流控、油滴包裹和barcode标签等技术来实现高通量的细胞分选与捕获,能够一次性分离、并标记500至数万个单细胞,测序后可获得每个细胞的转录组信息,具有细胞通量高、建库成本低、捕获周期短等优势。
[0005]典型的单细胞转录组测序实验流程如下,首 ...
【技术保护点】
【技术特征摘要】
1.一种单细胞转录组RNA污染去除方法,其特征在于,包括以下步骤:S1,根据基因表达量从大到小对barcode进行排序;S2,求得基因表达量变化幅度由小变大的A类拐点和基因表达量变化幅度由大变小的B类拐点;S3,取规定区间内对应基因表达量最大的A类拐点为起点拐点,对应基因表达量最小的B类拐点为终点拐点;将起点拐点到终点拐点之间的所有barcode设为背景barcode;S4,提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例;将表达比例大于污染阈值GP的基因设定为污染基因;S5,若存在污染基因,则判定单细胞转录组数据存在RNA污染;T1,根据污染基因在背景barcode中的表达谱,计算每个污染基因的基因表达量的平均值u1和标准差a1;T2,对细胞barcode进行分群,针对每一细胞群,分别计算污染基因在该群细胞中基因表达量的平均值u2和标准差a2;T3,根据公式Cp=(C
raw
‑
u2)/a2*a1+u1计算每个污染基因在每个细胞中的污染表达量Cp,再将细胞的污染基因的基因表达量C
raw
减去计算得到的污染表达量,则为实际表达量C
clean
。2.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述A类拐点的求解方法如下:SA21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;SA22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;SA23,当斜率的变化趋势为由小到大,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为A类拐点。3.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述B类拐点的求解方法如下:...
【专利技术属性】
技术研发人员:陈哲名,陈志锋,方超,韩斐然,
申请(专利权)人:杭州链康医学检验实验室有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。