【技术实现步骤摘要】
一种RNA
‑
Seq测序数据分析方法
[0001]本专利技术涉及生物信息
,更具体地说,本专利技术涉及一种转录组学二代测序RNA
‑
Seq数据的生物信息分析方法。
技术介绍
[0002]转录组学是组织、细胞在某种特定条件下转录出的全部RNA。转录组学分析是从RNA水平探究基因表达情况,通过对这些RNA的分析可以探究基因的转录情况和转录调控的规律,它是探究特定条件下细胞表型与功能的一个重要方法。近些年,随着测序技术的不断发展,下一代测序成本不断降低,使得越来越多的研究单位开始将RNA
‑
Seq技术应用到转录组学的研究,从而获取全转录本的基因表达信息。
[0003]随着RNA
‑
Seq技术应用的大量增多,如何高效、快捷、方便地分析处理这些测序下机数据,从中挖掘有价值的知识成为当前急需解决的问题。由于从下机数据预处理到获取基因表达信息,以及下游一些常规数据处理涉及大量不同软件、程序包,这些软件和包的安装以及依赖的运行环境安装比较复杂,对于它们的使用也需要足够的生物信息基础和编程能力,这对于很多刚接触RNA
‑
Seq的研究人员具有很大挑战。另外,出于高效运行的目的也需要搭建一个流程将不同的软件、包进行整合。目前,虽然已经出现几个RNA
‑
seq的数据分析流程,如RASflow、snakePipes,但是这些流程存在以下一些问题:1.技术门槛高,不利于没有较多生物信息学基础人员使用;2.环境配置复杂,数据分 ...
【技术保护点】
【技术特征摘要】
1.一种RNA
‑
Seq测序数据分析方法,其特征在于,其包括以下步骤:安装一个可移植的应用容器,其封装有RNA
‑
Seq数据分析所需的所有脚本、依赖资源、软件组件;以所述应用容器为平台拉取构建的容器镜像并根据其构建一流程容器;载入所述流程容器运行所需的运行环境,调用所述流程容器中封装的全局脚本,生成一个数据分析项目对RNA
‑
Seq数据进行数据分析;其中,生成一个数据分析项目对RNA
‑
Seq数据进行数据分析包括步骤:运行全局脚本,创建一个数据分析项目文件夹,其设有一一对应存放原始测序数据、流程各步骤分析的结果和中间文件、流程运行日志信息以及最终生成报告的若干个数据分析项目子文件夹;所述数据分析项目文件夹还生成有流程运行依赖的配置文件、样本信息表和流程脚本;导入待分析的RNA
‑
Seq测序数据,根据其填充所述样本信息表,根据需要可选的修改所述配置文件;启动分析自动化流程,开展运行前检测、模块化分析以及分析报告自动生成;所述模块化分析的分析模块至少包括质控、比对、计数、差异表达分析、分组比较、富集分析中的一个。2.如权利要求1所述的RNA
‑
Seq测序数据分析方法,其特征在于,调用所述流程容器中封装的全局脚本时,还传入一个位置参数,用于定义数据分析项目工作区的存放位置。3.如权利要求1所述的RNA
‑
Seq测序数据分析方法,其特征在于,运行全局脚本,创建一个数据分析项目文件夹时,所述全局脚本需要提供数据分析项目名称和分析数据类型,所述分析数据类型是双端测序或单端测序。4.如权利要求1所述的RNA
‑
Seq测序数据分析方法,其特征在于,所述样本信息表的第一列为对应输入的RNA
‑
Seq测序数据的样本名,第二列为每个样本对应的分组名。5.如权利要求1所述的RNA
‑
Seq测序数据分析方法,其特征在于,修改所述配置文件包括更换不同的比对方法和/或差异表达分析方法,和/或指定运行的至少一个所述分析模块。6.如权利要求4所述的RNA
‑
Seq测序数据分析方法,其特征在于,所述运行前检查包括步骤:根据自定义检查所述全局脚本,检查...
【专利技术属性】
技术研发人员:叶本晨,昝明辉,王东,安帅,刘莹,吴再辉,李潇亮,刘树然,
申请(专利权)人:郑州中科生物医学工程技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。