无参转录组分析系统及方法技术方案

技术编号:15052572 阅读:100 留言:0更新日期:2017-04-05 23:23
本发明专利技术涉及一种无参转录组分析系统及方法,该系统包括流程定制模块和数据挖掘模块;所述流程定制模块用于获取用户请求以及原始测序数据,并根据所述用户请求以及原始测序数据进行分析,以获取流程定制分析结果;所述数据挖掘模块用于根据所述流程定制分析结果进行无参考基因组的转录组测序分析,并展示所述转录组测序分析的结果。本发明专利技术可以实现对单个样品不能进行生物信息分析,并可以大大减少用户与生物信息分析人员之间的沟通环节,避免了分析信息的错漏,提高对测序数据的处理效率。

【技术实现步骤摘要】

本专利技术涉及生物信息分析
,特别涉及无参转录组分析系统及方法
技术介绍
随着第二代测序技术的迅猛发展,其高通量、快速、低成本的特点成为越来越多的生物学研究者在解决生物学问题时的首选,尤其在转录组测序方面更显示出极大的潜力。转录组(transcriptome)即特定生物体在某种状态下所有基因转录产物的总和,也是连接基因组遗传信息与生物功能(蛋白质组)的必然纽带。转录组研究是功能基因组研究的一项重要内容。相对于真核生物全基因组测序来说,转录组测序得到的序列不含有内含子及其它非编码序列,因此转录组测序有着无可比拟的高性价比优势。研究基因组结构的复杂性及遗传语言的根本规律,需要对测序所得的海量数据进行精准且全面的揭示和分析。目前转录组测序及分析技术可以解决新基因的深度发掘、低丰度转录本的发现、转录图谱绘制、可变剪接的调控、代谢途径确定、基因家族鉴定及进化分析等各方面的问题。转录组研究是基因功能及结构研究的基础和出发点,已经被广泛应用于医学、农学等各个领域。目前现存的转录组分析方式存在以下缺陷:对单个样品不能进行生物信息分析,且用户与生物信息分析人员之间存在很多沟通环节,例如需由客服人员向生物信息分析人员转达用户的需求,因此容易导致分析信息的错漏,影响测序数据的处理效率。
技术实现思路
针对现有技术中转录组分析方式对单个样品不能进行生物信息分析,对数据量比较大样品进行生物信息分析时所需运行的时间比较长的缺陷,本专利技术提出一种无参转录组分析系统及方法。第一方面,本专利技术提供了一种无参转录组分析系统,该系统包括流程定制模块和数据挖掘模块;所述流程定制模块用于获取用户请求以及原始测序数据,并根据所述用户请求以及原始测序数据进行分析,以获取流程定制分析结果;所述数据挖掘模块用于根据所述流程定制分析结果进行无参考基因组的转录组测序分析,并展示所述转录组测序分析的结果。优选地,所述流程定制分析结果包括Unigene集注释分析结果、差异表达基因集的注释和富集分析结果、各样品基因表达量、Unigene数据库及相关统计文件、简单重复序列SSR分析结果、单核苷酸多态性SNP分析结果以及编码区CDS预测结果、差异表达基因及其数目结果;其中,所述Unigene数据库为以所述原始测序数据作为输入数据通过从头denovo组装转录本Transcript构建转录组所得到的数据库,所述样品为所述原始测序数据的各个样品。优选地,所述数据挖掘模块包括:基因挖掘子模块,用于根据不同的预设检索类型并基于所述Unigene数据库进行基因信息的检索;表达量挖掘子模块,用于根据所述差异表达基因集的注释和富集分析结果挖掘基因表达量数据;差异基因挖掘子模块,用于根据所述差异表达基因及其数目结果挖掘差异表达基因数据。优选地,所述预设检索类型包括功能关键词检索、基因编号列表检索以及基因序列片段检索。优选地,所述数据挖掘模块包括:常用数据与软件子模块,用于分块展示所述流程定制分析结果,并以所述流程定制分析结果作为输入量调用预先存储的后续分析软件进行后续分析。优选地,所述常用数据与软件子模块包括:注释富集单元,用于展示所述Unigene集注释分析结果、差异表达基因集的注释和富集分析结果;基因表达单元,用于展示所述各样品基因表达量、Unigene库及相关统计文件;基因结构单元,用于展示简单重复序列SSR分析结果、单核苷酸多态性SNP分析结果以及编码区CDS预测结果。优选地,所述差异基因挖掘子模块包括:差异表达基因查询单元,用于展示所述差异表达基因数据;差异表达基因集维恩图,用于根据所述差异表达基因数据绘制差异表达基因集的维恩图,所述差异表达基因集为所述原始测序数据的各个样品间的差异表达基因集;基因共表达趋势分析,用于根据所述差异表达基因数据识别差异表达基因的共表达模式。优选地,所述流程定制模块包括:测序数据导入子模块,用于提示用户导入预设格式的所述原始测序数据;转录组组装子模块,用于将所述原始测序数据reads拼接成转录本Transcript,并根据该转录本进行转录组组装;基因功能注释子模块,用于通过多个预先建立的云数据库对Unigene中的基因数据进行功能注释;差异表达分析子模块,用于根据预设筛选指标筛选所述原始测序数据的所述差异表达基因及其数目结果,所述差异表达基因及其数目结果包括各个样品之间的差异表达基因以及所述差异表达基因的数目;其中,所述差异表达基因包括上调基因和下调基因;相应地,所述差异表达基因的数目包括上调基因的数目和下调基因的数目;所述预设筛选指标包括差异筛选倍数和错误发现率。优选地,所述转录组组装子模块进一步用于将所述原始测序数据reads拼接成转录本Transcript,并根据该转录本和Trintity组装软件进行转录组组装,所述Trintity组装软件为预先编写的用于对所述原始测序数据进行组装的软件。第二方面,本专利技术还公开了一种无参转录组分析方法,该方法包括:获取用户请求以及原始测序数据,并根据所述用户请求以及原始测序数据进行分析,以获取流程定制分析结果;根据所述流程定制分析结果进行无参考基因组的转录组测序分析,并展示所述转录组测序分析的结果。本专利技术可以实现对单个样品不能进行生物信息分析,并可以大大减少用户与生物信息分析人员之间的沟通环节,避免了分析信息的错漏,提高对测序数据的处理效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本专利技术一个实施例的无参转录组分析系统的结构框图;图2示出了本专利技术一个实施例的无参转录组分析方法的流程图;图3示出了本专利技术一个实施例的流程定制模块的界面示意图;图4示出了本专利技术一个实施例的差异基因挖掘子模块的界面示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的本文档来自技高网...

【技术保护点】
一种无参转录组分析系统,其特征在于,包括流程定制模块和数据挖掘模块;所述流程定制模块用于获取用户请求以及原始测序数据,并根据所述用户请求以及原始测序数据进行分析,以获取流程定制分析结果;所述数据挖掘模块用于根据所述流程定制分析结果进行无参考基因组的转录组测序分析,并展示所述转录组测序分析的结果。

【技术特征摘要】
1.一种无参转录组分析系统,其特征在于,包括流程定制模块
和数据挖掘模块;
所述流程定制模块用于获取用户请求以及原始测序数据,并根据
所述用户请求以及原始测序数据进行分析,以获取流程定制分析结
果;
所述数据挖掘模块用于根据所述流程定制分析结果进行无参考
基因组的转录组测序分析,并展示所述转录组测序分析的结果。
2.如权利要求1所述的系统,其特征在于,所述流程定制分析结
果包括Unigene集注释分析结果、差异表达基因集的注释和富集分析
结果、各样品基因表达量、Unigene数据库及相关统计文件、简单重
复序列SSR分析结果、单核苷酸多态性SNP分析结果以及编码区CDS
预测结果、差异表达基因及其数目结果;
其中,所述Unigene数据库为以所述原始测序数据作为输入数据
通过从头denovo组装转录本Transcript构建转录组所得到的数据库,
所述样品为所述原始测序数据的各个样品。
3.如权利要求2所述的系统,其特征在于,所述数据挖掘模块包
括:
基因挖掘子模块,用于根据不同的预设检索类型并基于所述
Unigene数据库进行基因信息的检索;
表达量挖掘子模块,用于根据所述差异表达基因集的注释和富集
分析结果挖掘基因表达量数据;
差异基因挖掘子模块,用于根据所述差异表达基因及其数目结果
挖掘差异表达基因数据。
4.如权利要求3所述的系统,其特征在于,所述预设检索类型包
括功能关键词检索、基因编号列表检索以及基因序列片段检索。
5.如权利要求3所述的系统,其特征在于,所述数据挖掘模块包

\t括:
常用数据与软件子模块,用于分块展示所述流程定制分析结果,
并以所述流程定制分析结果作为输入量调用预先存储的后续分析软
件进行后续分析。
6.如权利要求5所述的系统,其特征在于,所述常用数据与软件
子模块包括:
注释富集单元,用于展示所述Unigene集注释分析结果、差异表
达基因集的注释和富集分析结果;
基因表达单元,用于展示所述各样品基因表达量、Unigene库及
相关统计...

【专利技术属性】
技术研发人员:郑洪坤孔关义李彩琴
申请(专利权)人:北京百迈客生物科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1