The invention discloses a method for analyzing microRNA data based on the reference microRNA sequence of non-native species in the Microbase database, which is characterized by the following steps: file preparation step; off-line data filtering step; sRNA classification annotation step; microRNA differential analysis step; microRNA function and pathway analysis step; microRNA sequence characteristic analysis step; and result collation step. The beneficial effect of the present invention is to analyze the sequencing data of microRNAs for reference microRNAs of non-native species. The results were comprehensive, including the contents of microRNA analysis and other annotations of small RNA information detected. Automatically collate all the analysis results, after completing the analysis of each part, automatically statistics, visualization, and classification of the results, so that the results can be arranged at a glance, and directly used for report generation. All operation steps are visible to facilitate error query.
【技术实现步骤摘要】
一种基于miRBase数据库的无参的miRNA数据分析方法
本专利技术涉及转录组测序领域,具体涉及一种在miRBase数据库中无本物种参考miRNA数据的miRNA测序的数据分析方法。
技术介绍
miRNA是一类由内源基因编码非编码单链RNA分子,在动植物中参与转录后基因表达调控。多数miRNA以单拷贝、多拷贝或基因簇的形式存在于基因组中。miRNA在很多物种中被广泛发现,且在进化进程中高度保守,因此研究miRNA的确切功能、目的靶基因、以及其作用机制,是转录组学数据分析中的重要一环,对于了解生物体内基因的表达调控机制有重要意义。miRNA的作用机制在动物和植物之间存在明显差异,且有的物种有丰富的miRNA参考数据,但有的物种缺乏参考数据,甚至有些物种没有参考基因组信息,这些情况下的miRNA测序的数据分析方法十分不同。由于不同物种中的miRNA有一定的保守性,因此对于没有本物种参考miRNA数据的测序结果,也可以进行分析。但是目前还没有针对无参考miRNA数据的miRNA测序数据分析工具。也没有现成的流程分析能同时分析动物和植物小RNA测序数据;尤其是没有自动化的分析平台实现小RNA测序结果的流程化分析工具,包括后续的sRNA注释,miRNA序列的特征分析,表达量分析和差异分析,靶基因位点分析,等各个步骤的自动化整合。
技术实现思路
为了克服现有技术所存在的上述缺陷,本专利技术的目的在于提供一种基于miRBase数据库的无参的miRNA数据分析方法。为了实现本专利技术的目的之一,所采用的技术方案是:一种基于miRBase数据库的无参的miRNA数据分析方法, ...
【技术保护点】
1.一种基于miRBase数据库的无参的miRNA数据分析方法,其特征在于,包括如下步骤:步骤一,文件准备步骤:准备并读取config文件,读取后生成相应的shell脚本,在运行同时每一步都会有运行日志,方便结果检查;步骤二,下机数据过滤步骤:下机后的原始数据,去除接头,然后过滤低质量序列,即:以5个碱基长度为窗口对原始序列进行搜索,当窗口中碱基的平均测序质量低于20时,将从窗口最前端开始的部分截断并舍弃。将过滤后的数据进行去重,获得无重复的序列,并标记所有序列数量。同时对原始数据和过滤数据量进行统计,并以柱状图展示不同长度的序列的数量分布特征。过滤序列用于后续分析;步骤三,sRNA分类注释步骤:将去重后的序列与Rfam数据库进行blast比对,筛选出碱基错配数小于2的结果,注释出其中的非编码RNA序列,将其余的小RNA序列与miRBase数据库中动物或植物的miRNA成熟体序列进行比对,筛选出碱基错配数小于2的结果,注释为已知的miRNA序列,同时计算测到的miRNA表达量,进行表达模式分析并命名;步骤四,miRNA差异分析步骤:根据上一步注释到的miRNA信息以及表达量结果,使用D ...
【技术特征摘要】
1.一种基于miRBase数据库的无参的miRNA数据分析方法,其特征在于,包括如下步骤:步骤一,文件准备步骤:准备并读取config文件,读取后生成相应的shell脚本,在运行同时每一步都会有运行日志,方便结果检查;步骤二,下机数据过滤步骤:下机后的原始数据,去除接头,然后过滤低质量序列,即:以5个碱基长度为窗口对原始序列进行搜索,当窗口中碱基的平均测序质量低于20时,将从窗口最前端开始的部分截断并舍弃。将过滤后的数据进行去重,获得无重复的序列,并标记所有序列数量。同时对原始数据和过滤数据量进行统计,并以柱状图展示不同长度的序列的数量分布特征。过滤序列用于后续分析;步骤三,sRNA分类注释步骤:将去重后的序列与Rfam数据库进行blast比对,筛选出碱基错配数小于2的结果,注释出其中的非编码RNA序列,将其余的小RNA序列与miRBase数据库中动物或植物的miRNA成熟体序列进行比对,筛选出碱基错配数小于2的结果,注释为已知的miRNA序列,同时计算测到的miRNA表达量,进行表达模式分析并命名;步骤四,miRNA差异分析步骤:根据上一步注释到的miRNA信息以及表达量结果,使用DESeq进行差异表达分析,并按照差异倍数(FoldChange>2)和显著性(Pvalue<0.05)筛选差异表达的miRNA,并绘制图像;步骤五,miRNA功能和通路分析步骤:以目标物种的mRNA的3’UTR序列或mRNA序列为目标序列,使用miRanda软件或psRobot软件对差异表达的miRNA序列,进行靶基因位点搜索;对上一步预测到的miRNA靶基因进行GO功能和KEGG通路的富集分析,获得差异miRNA可能参与的功能和代谢通路;步骤六,miRNA序列特征分析步骤:对miRNA碱基偏好性进行分析;步骤七,结果整理步...
【专利技术属性】
技术研发人员:王玲平,王智健,姜丽荣,沈立,孙子奎,
申请(专利权)人:南京派森诺基因科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。