一种Drop‑seq数据质量控制和分析方法技术

技术编号:16779809 阅读:129 留言:0更新日期:2017-12-13 00:01
本发明专利技术公开了一种Drop‑seq数据质量控制和分析方法,属于生物学技术领域。其包括以下步骤:第一步、使用两个配对的测序文件作为输入文件;第二步、对测序文件进行处理;第三步、测序片段的层面、多细胞的层面、单个细胞的层面以及细胞聚类的层面对Drop‑seq数据进行质量控制流程的开发。第四步、给用户提供一份报告文档。本发明专利技术以Drop‑seq数据研究作为出发点,主要涵盖测序片段层面的质量控制、多细胞层面的质量控制以及单个细胞层面的质量控制,借助Drop‑seq数据对单个细胞的标识,针对细胞异质性的特点与来源进行生物信息方法开发,探究细胞异质性对细胞基因表达与表观特征的影响。

A Drop SEQ data quality control and analysis methods

The invention discloses a Drop SEQ data quality control and analysis method, which belongs to the technical field of biology. It includes the following steps: the first step, using two pairs of sequence files as input file; the second step, the sequence file for processing; the third step, sequencing fragment level, multicellular level, single cell level and cell clustering level of Drop SEQ data quality control process of development. The fourth step is to provide a report document to the user. The present invention uses Drop SEQ data as a starting point, mainly covers the fragment level quality control, quality control and quality level of multicellular single cell level control, by means of identifying the Drop SEQ data on individual cells, for the development of bioinformatics methods according to the characteristics and sources of heterogeneity, explore the impact of cell heterogeneity the gene expression and epigenetic characteristics.

【技术实现步骤摘要】
一种Drop-seq数据质量控制和分析方法
本专利技术属于生物学
,特别涉及基于Drop-seq数据特征的生物信息分析
,开展基于Drop-seq数据的质量控制与数据分析流程的探究和开发。
技术介绍
随着第二代测序(Next-generationsequencing)技术的飞速发展,逐步增长的通量和逐年降低的测序成本使得人们利用测序技术对转录组学与表观遗传组学的研究逐渐深入,并开发了一系列定量研究手段如用于检测特定条件下各基因的表达水平的转录组测序技术(RNA-seq)以及定性研究手段如用于观测DNA与转录因子蛋白相互作用的染色质免疫共沉淀技术(ChIP-seq)。随着第二代测序的通量和分辨率不断提高,一些其它方面的问题也逐渐出现,为了解决细胞异质性以及稀有细胞无法检测的问题,近年来开发了基于单细胞的测序技术。scRNA-seq技术,可以获得单个细胞的全基因组表达谱,从而使scRNA-seq技术成为同时研究上千个细胞之间的表达差异的的工具。伴随着scRNA-seq技术飞速的发展,与此同时其数据分析的方法也越来越成熟。单细胞测序数据分析的生物信息学方法也与传统的多细胞测序数本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201710638356.html" title="一种Drop‑seq数据质量控制和分析方法原文来自X技术">Drop‑seq数据质量控制和分析方法</a>

【技术保护点】
一种Drop‑seq数据质量控制和分析方法,其特征在于:包括以下步骤:第一步、使用两个配对的测序文件作为输入文件;第二步、对测序文件进行处理;第三步、提供以下层面的质量控制的测量;(1)测序片段层面的质量控制包括测序片段的质量、核苷酸的组成以及测序片段的GC含量;(2)多细胞层面的质量控制包括基因区域的覆盖程度和序列回帖率;(3)单个细胞层面的质量控制包括,通过对挑选出的STAMPs计算其测序片段的重复率分布、位于内含子的测序片段的比例和覆盖基因的数目,从而在单细胞层面上对mRNA的捕获效率进行评估;(4)所述细胞聚类层面的质量控制包括,通过计算gap statistic和silhouette...

【技术特征摘要】
1.一种Drop-seq数据质量控制和分析方法,其特征在于:包括以下步骤:第一步、使用两个配对的测序文件作为输入文件;第二步、对测序文件进行处理;第三步、提供以下层面的质量控制的测量;(1)测序片段层面的质量控制包括测序片段的质量、核苷酸的组成以及测序片段的GC含量;(2)多细胞层面的质量控制包括基因区域的覆盖程度和序列回帖率;(3)单个细胞层面的质量控制包括,通过对挑选出的STAMPs计算其测序片段的重复率分布、位于内含子的测序片段的比例和覆盖基因的数目,从而在单细胞层面上对mRNA的捕获效率进行评估;(4)所述细胞聚类层面的质量控制包括,通过计算gapstatistic和silhouettescore,对样本的异质性进行评估;第四步、给用户提供一份质量控制的报告文档,其中描述了第三步中质量控制的测量值。2.根据权利要求1所述的Drop-seq数据质量控制和分析方法,其特征在于:还包括以下步骤,第五步,提供产生以下一项或多项的分析结果,(1)表达指数;(2)pair-wise相关表;(3)主成分分析(PCA)和t-SNE降维的输出结果;(4)筛选出的STAMPs的聚类簇的分配结果;(5)t-SNE和聚类结果的可视化输出。3.根据权利要求1所述Drop-seq数据质量控制和分析方法,其特征在于,所述第一步中的其中一个文件包含转录本的信息,另一个文件包含细胞条形码和UMI的信息。4.根据权利要求1所述Drop-seq数据质量控制和分析方法,其特征在于,所述第二步中对测序数据的处理方法为把转录本的测序文件比对到参考基因组上,且只留取具有高测序质量的比对上的测序片段。5.根据权利要求1所述Drop-seq数据质量控制和分析方法,其特征在于:第三步(1)中的测序片段层面的质量控制方法为,将Drop-seq数据看作是多细胞RNA-seq数据进行分析;对测序质量分布、每个测序位点的碱基组成以及每个测序片段的GC含量这几个测度进行计算。6.根据权利要求1所述Drop-seq数据质量控制和分析方法,其特征在于:所述第三步(2)中的多细胞层面的质量控制部分方法为,列出测序片段的比对结果总结,包括序列的回帖率和全基因组范围的序列分布,并通过绘制基因区域的序列覆盖程度来估计5’端...

【专利技术属性】
技术研发人员:张勇张超施威扬王璐莹
申请(专利权)人:浙江绍兴千寻生物科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1