一种环状RNA测序数据在线交互分析系统技术方案

技术编号:28875419 阅读:19 留言:0更新日期:2021-06-15 23:10
本发明专利技术提供一种环状RNA测序数据在线交互分析系统,数据过滤模块与序列比对分析模块连接,序列比对分析模块与环状RNA鉴定模块连接,环状RNA鉴定模块分别与差异分析模块、目标来源基因分析模块、目标circRNA分析模块、样本关系模块连接,样本分组模块、RNA集筛选模块、交互分析模块独立存在于系统中,本发明专利技术的环状RNA测序数据在线交互分析系统,通过多项模块,能够实现全流程的数据分析,通过过滤无效数据、后续对比分析,鉴定与过滤环状RNA等多种功能;本发明专利技术的系统架构实现动态交互,使数据挖掘环状RNA,及其来源基因更便捷和高效;此外,系统可实现个性化高效的可视化展示。

【技术实现步骤摘要】
一种环状RNA测序数据在线交互分析系统
本专利技术涉及生物
,具体涉及生物信息分析领域,更具体的涉及一种环状RNA测序数据在线交互分析系统。
技术介绍
环状RNA(circRNA)是一类特殊的非编码RNA分子(在活体中有时也有表达),也是RNA领域最新的研究热点。与传统的线性RNA不同(传统的线性RNA含5’和3’末端,而环状RNA是一类不具有5'末端帽子和3'末端poly(A)尾巴、并以共价键形成环形结构的非编码RNA分子)。由于circRNA分子呈封闭环状结构,不受RNA外切酶影响,表达更稳定,不易降解。在功能上,近年的研究表明,circRNA分子富含microRNA(miRNA)结合位点,在细胞中起到miRNA海绵(miRNAsponge)的作用,进而解除miRNA对其靶基因的抑制作用,升高靶基因的表达水平;这一作用机制被称为竞争性内源RNA(ceRNA)机制。通过与疾病关联的miRNA相互作用,circRNA在疾病中发挥着重要的调控作用。circRNA的研究离不开高通量测序和各种生物信息学方法,circRNA-seq测序针对样本中的环状RNA进行高通量测序,将得到的reads与基因组进行比对,没有比对到基因组上的reads截取其两端各20bp作为锚点(AnchorsReads),锚点(AnchorsReads)将再一次比对到基因组上,检查其GT/AG剪接信号的存在与否作为判定潜circRNA的依据。但是目前还没有分析circRNA的金指标,利用生物信息学算法做的预测也有偏差。circRNA主要来源于基因外显子,但多项研究也表明circRNA的类型比想象的要复杂,可以来自基因组上多种基因结构。因此,挖掘目标环状RNA,及其目标来源基因的分析对circRNA的研究至关重要,因此本申请提供一项这样的系统,可实现目前现有技术无法达到的功能。
技术实现思路
针对上述
技术介绍
中提到的问题,本专利技术提供了一种环状RNA测序数据在线交互分析系统,包括数据过滤模块、序列比对分析模块、环状RNA鉴定模块、样本关系模块、差异分析模块、目标circRNA分析模块、目标来源基因分析模块、RNA集筛选模块、样本分组模块、交互分析模块;所述数据过滤模块与所述序列比对分析模块连接,所述序列比对分析模块与所述环状RNA鉴定模块连接,所述环状RNA鉴定模块分别与所述差异分析模块、所述目标来源基因分析模块、所述目标circRNA分析模块、所述样本关系模块连接,所述样本分组模块、所述RNA集筛选模块、所述交互分析模块独立存在于系统中。具体的,还包括数据库注释模块、靶向预测模块、circRNA-miRNA-mRNA关联分析模块,所述数据库注释模块、靶向预测模块、circRNA-miRNA-mRNA关联分析模块依次相连。具体的,所述数据过滤模块的具体过滤步骤及标准为:S1、去除含adapter的reads;S2、去除含N比例大于10%的readsS3、去除全部都是A碱基的readsS4、去除低质量reads,其中,低质量reads为质量值Q≤20的碱基数占整条read的50%。具体的,所述序列比对分析模块包括核糖体比对分析和比对参考基因组。具体的,所述环状RNA鉴定模块进行环状RNA鉴定并过滤得到高度可信的环状RNA,过滤步骤与条件如下:S21、breakpoints=1,只保留有且只有1个清晰breakpoint的环状RNA;S22、anchor_overlap<=2,每条Reads的两个AnchorsReads比对到基因组上的位置overlap不能超过2bp;S23、edit<=2,只允许2bp错配;S24、n_uniq>2,uniqReads大于2条;S25、best_qual_A>35或best_qual_B>35,每条Reads的其中一个AnchorsReads比对到基因组上最好的Mapping结果要比其排第二的结果的分值高35分以上;S26、n_uniq>int(samples/2),支持该环状RNA的uniqreads要大于总样品数的二分之一;S27、环状RNA的长度小于100k。具体的,所述差异分析模块涵盖样本间差异分析和组间差异分析,分析步骤包括:S31、对readcount进行标准化,即normalization;S32、根据模型进行假设检验概率的计算,即pvalue的计算;S33、进行多重假设检验校正,得到FDR值,即错误发现率,并对挑选出的所有差异circRNA的来源基因进行富集分析。具体的,所述样本分组模块用于接受客户端用户的选择请求,重新按用户选择自定义选择分组方案,用于调整样本信息或重新进行样本分组分析;所述RNA集筛选模块用于接受客户端用户的选择请求,执行新增circRNA集、合并circRNA集、circRNA筛选,以及合并来源基因集、来源基因集筛选来完成筛选基因。具体的,所述交互分析模块可以根据所述样本分组模块和所述RNA集筛选模块接收的客户端请求重置分析参数,实现所述环状RNA鉴定模块、所述差异分析模块、所述差异分析模块的分析内容以及所述目标来源基因分析模块、所述目标来源基因分析模块的分析内容。本专利技术的环状RNA测序数据在线交互分析系统,通过多项模块,能够实现全流程的数据分析,通过过滤无效数据、后续对比分析,鉴定与过滤环状RNA等多种功能;本专利技术的系统架构实现动态交互,使数据挖掘环状RNA,及其来源基因更便捷和高效;此外,系统可实现个性化高效的可视化展示。附图说明图1为本专利技术的系统组成框图。具体实施方式下面结合附图1和实施方式对本专利技术作进一步说明,图1为本专利技术的系统组成框图。实施例一在本专利技术的一种实施例中,参阅附图1,一种环状RNA测序数据在线交互分析系统,包括数据过滤模块、序列比对分析模块、环状RNA鉴定模块、样本关系模块、差异分析模块、目标circRNA分析模块、目标来源基因分析模块、RNA集筛选模块、样本分组模块、交互分析模块;所述数据过滤模块与所述序列比对分析模块连接,所述序列比对分析模块与所述环状RNA鉴定模块连接,所述环状RNA鉴定模块分别与所述差异分析模块、所述目标来源基因分析模块、所述目标circRNA分析模块、所述样本关系模块连接,所述样本分组模块、所述RNA集筛选模块、所述交互分析模块独立存在于系统中。还包括数据库注释模块、靶向预测模块、circRNA-miRNA-mRNA关联分析模块,所述数据库注释模块、靶向预测模块、circRNA-miRNA-mRNA关联分析模块依次相连。还包括交互分析模块,所述交互分析模块与所述样本关系模块、差异分析模块、目标circRNA分析模块、目标来源基因分析模块相连。本实施例中,数据过滤模块在系统获得上传后的下机数据,为了保证数据质量,对原始数据进行数据过滤本文档来自技高网
...

【技术保护点】
1.一种环状RNA测序数据在线交互分析系统,其特征在于,包括数据过滤模块、序列比对分析模块、环状RNA鉴定模块、样本关系模块、差异分析模块、目标circRNA分析模块、目标来源基因分析模块、RNA集筛选模块、样本分组模块、交互分析模块;/n所述数据过滤模块与所述序列比对分析模块连接,所述序列比对分析模块与所述环状RNA鉴定模块连接,所述环状RNA鉴定模块分别与所述差异分析模块、所述目标来源基因分析模块、所述目标circRNA分析模块、所述样本关系模块连接,所述样本分组模块、所述RNA集筛选模块、所述交互分析模块独立存在于系统中。/n

【技术特征摘要】
1.一种环状RNA测序数据在线交互分析系统,其特征在于,包括数据过滤模块、序列比对分析模块、环状RNA鉴定模块、样本关系模块、差异分析模块、目标circRNA分析模块、目标来源基因分析模块、RNA集筛选模块、样本分组模块、交互分析模块;
所述数据过滤模块与所述序列比对分析模块连接,所述序列比对分析模块与所述环状RNA鉴定模块连接,所述环状RNA鉴定模块分别与所述差异分析模块、所述目标来源基因分析模块、所述目标circRNA分析模块、所述样本关系模块连接,所述样本分组模块、所述RNA集筛选模块、所述交互分析模块独立存在于系统中。


2.根据权利要求1所述的环状RNA测序数据在线交互分析系统,其特征在于,还包括数据库注释模块、靶向预测模块、circRNA-miRNA-mRNA关联分析模块,所述数据库注释模块、靶向预测模块、circRNA-miRNA-mRNA关联分析模块依次相连。


3.根据权利要求1所述的环状RNA测序数据在线交互分析系统,其特征在于,所述数据过滤模块的具体过滤步骤及标准为:
S1、去除含adapter的reads;
S2、去除含N比例大于10%的reads
S3、去除全部都是A碱基的reads
S4、去除低质量reads,其中,低质量reads为质量值Q≤20的碱基数占整条read的50%。


4.根据权利要求1所述的环状RNA测序数据在线交互分析系统,其特征在于,所述序列比对分析模块包括核糖体比对分析和比对参考基因组。


5.根据权利要求1所述的环状RNA测序数据在线交互分析系统,其特征在于,所述环状RNA鉴定模块进行环状RNA鉴定并过滤得到高度可信的环状RNA,过滤步骤与条件如下:
S21、breakpoints=1,只保留有且只有1个清晰breakpoint的环状RNA;
S22、anchor_overlap<=2,每条Reads的两个Anc...

【专利技术属性】
技术研发人员:周煌凯高川陈飞钦艾鹏陈建周张秋雪
申请(专利权)人:广州基迪奥生物科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1