circRNA检测方法、计算机程序产品及系统技术方案

技术编号:36816885 阅读:7 留言:0更新日期:2023-03-12 00:29
本申请提供了一种circRNA检测方法、计算机程序产品及系统。所述circRNA检测方法包括:从待测样品中筛选出符合预定品质的目标样品;基于所述目标样品与参考基因组的比对关系,选择出候选circRNA;从所述候选circRNA中选出待重注释circRNA,其中所述待重注释circRNA的起始碱基与参考circRNA数据库中的已知circRNA的起始碱基相对于所述参考基因组的绝对位置差不大于第一阈值,并且所述待重注释circRNA的终止碱基与所述已知circRNA的终止碱基相对于所述参考基因组的绝对位置差不大于第二阈值;以及基于所述已知circRNA的信息为所述待重注释circRNA添加注释信息。重注释circRNA添加注释信息。重注释circRNA添加注释信息。

【技术实现步骤摘要】
circRNA检测方法、计算机程序产品及系统


[0001]本申请涉及生物信息领域,更具体地,涉及一种circRNA检测方法、计算机程序产品及系统。

技术介绍

[0002]circRNA也称为环状RNA,通过特殊的可变剪切而形成,是一类不具有5

末端帽子(cap)和3

末端poly(A)尾巴,并且以共价键形成环形结构的RNA。circRNA是近些年RNA领域的研究和应用热点。
[0003]circRNA相较于线性RNA具有诸多特性和功能。由于circRNA以封闭环状结构的形式存在,不容易被RNA核酸外切酶或者RNase R降解,因此其比线性RNA稳定。另外,许多circRNA可作为竞争性内源RNA,可以竞争性地结合miRNA,是miRNA的海绵吸附体,可以调控生物体基因的表达。此外,circRNA具有组织特异性和发育阶段特异性,可以作为许多疾病诊断的生物标记物(biomarker)。由于circRNA所具有的诸多特性和功能,对circRNA进行检测分析,具有重要的应用价值。

技术实现思路

[0004]本申请提供了一种circRNA检测方法,包括:从待测样品中筛选出符合预定品质的目标样品;基于所述目标样品与参考基因组的比对关系,选择出候选circRNA;从所述候选circRNA中选出待重注释circRNA,其中所述待重注释circRNA的起始碱基与参考circRNA数据库中的已知circRNA的起始碱基相对于所述参考基因组的绝对位置差不大于第一阈值,并且所述待重注释circRNA的终止碱基与所述已知circRNA的终止碱基相对于所述参考基因组的绝对位置差不大于第二阈值;以及基于所述已知circRNA的信息为所述待重注释circRNA添加注释信息。
[0005]根据本申请实施方式,所述第一阈值和所述第二阈值被设置为:随着所述第一阈值和/或所述第二阈值的增加,所述候选circRNA中能够匹配到所述参考circRNA数据库中的已知circRNA的数量变化曲线的拐点值。
[0006]根据本申请实施方式,所述第一阈值和所述第二阈值在0至5之间。
[0007]根据本申请实施方式,所述第一阈值和所述第二阈值在3至5之间。
[0008]根据本申请实施方式,所述第一阈值和所述第二阈值均为5。
[0009]根据本申请实施方式,所述第一阈值和所述第二阈值均为3。
[0010]根据本申请实施方式,基于所述目标样品与参考基因组的比对关系,选择出候选circRNA包括:将所述目标样品与所述参考基因组进行匹配,并从所述目标样品中的、无法匹配到所述参考基因组的序列中选出所述候选circRNA。
[0011]根据本申请实施方式,基于所述已知circRNA的信息为所述待重注释circRNA添加注释信息包括:基于所述待重注释circRNA的起始碱基与所述已知circRNA的起始碱基相对于所述参考基因组的绝对位置差以及所述待重注释circRNA的终止碱基与所述已知
circRNA的终止碱基相对于所述参考基因组的绝对位置差,标记所述待重注释circRNA与所述已知circRNA的相似度。
[0012]根据本申请实施方式,从所述目标样品中的、无法匹配到所述参考基因组的序列中选出所述候选circRNA包括:分别使用find_circ软件和CIRCexplorer2软件基于反向剪切点将所述无法匹配到所述参考基因组的序列与所述参考基因组重新进行比对,选择出所述候选circRNA,其中,所述候选circRNA是以下两组候选circRNA的交集:使用所述find_circ软件基于重新比对结果选择出的第一候选circRNA;以及使用所述CIRCexplorer2软件基于重新比对结果选择出的第二候选circRNA。
[0013]根据本申请实施方式,所述circRNA检测方法还包括:基于开放阅读框和内部核糖体进入位点预测添加注释信息后的所述待重注释circRNA的编码潜能。
[0014]本申请还提供了一种用于circRNA检测的计算机程序产品,包括计算机可读指令,所述计算机可读指令被处理器执行时实现以下操作:从待测样品中筛选出符合预定品质的目标样品;基于所述目标样品与参考基因组的比对关系,选择出候选circRNA;从所述候选circRNA中选出待重注释circRNA,其中所述待重注释circRNA的起始碱基与参考circRNA数据库中的已知circRNA的起始碱基相对于所述参考基因组的绝对位置差不大于第一阈值,并且所述待重注释circRNA的终止碱基与所述已知circRNA的终止碱基相对于所述参考基因组的绝对位置差不大于第二阈值;以及基于所述已知circRNA的信息为所述待重注释circRNA添加注释信息。
[0015]根据本申请实施方式,所述第一阈值和所述第二阈值被设置为:随着所述第一阈值和/或所述第二阈值的增加,所述候选circRNA中能够匹配到所述参考circRNA数据库中的已知circRNA的数量变化曲线的拐点值。
[0016]根据本申请实施方式,所述第一阈值和所述第二阈值在0至5之间。
[0017]根据本申请实施方式,所述第一阈值和所述第二阈值在3至5之间。
[0018]根据本申请实施方式,所述第一阈值和所述第二阈值均为5。
[0019]根据本申请实施方式,所述第一阈值和所述第二阈值均为3。
[0020]根据本申请实施方式,基于所述目标样品与参考基因组的比对关系,选择出候选circRNA包括:将所述目标样品与所述参考基因组进行匹配,并从所述目标样品中的、无法匹配到所述参考基因组的序列中选出所述候选circRNA。
[0021]根据本申请实施方式,基于所述已知circRNA的信息为所述待重注释circRNA添加注释信息包括:基于所述待重注释circRNA的起始碱基与所述已知circRNA的起始碱基相对于所述参考基因组的绝对位置差以及所述待重注释circRNA的终止碱基与所述已知circRNA的终止碱基相对于所述参考基因组的绝对位置差,标记所述待重注释circRNA与所述已知circRNA的相似度。
[0022]根据本申请实施方式,从所述目标样品中的、无法匹配到所述参考基因组的序列中选出所述候选circRNA包括:分别使用find_circ软件和CIRCexplorer2软件基于反向剪切点将所述无法匹配到所述参考基因组的序列与所述参考基因组重新进行比对,选择出所述候选circRNA,其中,所述候选circRNA是以下两组候选circRNA的交集:使用所述find_circ软件基于重新比对结果选择出的第一候选circRNA;以及使用所述CIRCexplorer2软件基于重新比对结果选择出的第二候选circRNA。
[0023]根据本申请实施方式,所述操作还包括:基于开放阅读框和内部核糖体进入位点预测添加注释信息后的所述待重注释circRNA的编码潜能。
[0024]本申请还提供了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种circRNA检测方法,包括:从待测样品中筛选出符合预定品质的目标样品;基于所述目标样品与参考基因组的比对关系,选择出候选circRNA;从所述候选circRNA中选出待重注释circRNA,其中所述待重注释circRNA的起始碱基与参考circRNA数据库中的已知circRNA的起始碱基相对于所述参考基因组的绝对位置差不大于第一阈值,并且所述待重注释circRNA的终止碱基与所述已知circRNA的终止碱基相对于所述参考基因组的绝对位置差不大于第二阈值;以及基于所述已知circRNA的信息为所述待重注释circRNA添加注释信息。2.根据权利要求1所述的circRNA检测方法,其中,所述第一阈值和所述第二阈值被设置为:随着所述第一阈值和/或所述第二阈值的增加,所述候选circRNA中能够匹配到所述参考circRNA数据库中的已知circRNA的数量变化曲线的拐点值。3.根据权利要求1所述的circRNA检测方法,其中,所述第一阈值和所述第二阈值在0至5之间。4.根据权利要求3所述的circRNA检测方法,其中,所述第一阈值和所述第二阈值在3至5之间。5.根据权利要求3所述的circRNA检测方法,其中,所述第一阈值和所述第二阈值均为5。6.根据权利要求3所述的circRNA检测方法,其中,所述第一阈值和所述第二阈值均为3。7.根据权利要求1所述的circRNA检测方法,其中,基于所述目标样品与参考基因组的比对关系,选择出候选circRNA包括:将所述目标样品与所述参考基因组进行匹配,并从所述目标样品中的、无法匹配到所述参考基因组的序列中选出所述候选circRNA。8.根据权利要求1所述的circRNA检测方法,其中,基于所述已知circRNA的信息为所述待重注释circRNA添加注释信息包括:基于所述待重注释circRNA的起始碱基与所述已知circRNA的起始碱基相对于所述参考基因组的绝对位置差,以及所述待重注释circRNA的终止碱基与所述已知circRNA的终止碱基相对于所述参考基因组的绝对位置差,标记所述待重注释circRNA与所述已知circRNA的相似度。9.根据权利要求7所述的circRNA检测方法,其中,从所述目标样品中的、无法匹配到所述参考基因组的序列中选出所述候选circRNA,包括:分别使用f...

【专利技术属性】
技术研发人员:张盼玉范文涛裘宇容王勇斯温韵洁李奎全智慧
申请(专利权)人:广州华银康医疗集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1