当前位置: 首页 > 专利查询>五邑大学专利>正文

一种基于R平台的全基因下游分析工具制造技术

技术编号:35690096 阅读:11 留言:0更新日期:2022-11-23 14:37
本申请涉及一种基于R平台的全基因下游分析工具,所述工具包括:数据读取及展示模块,用于对输入数据的压缩包进行解压、读取及展示;其中,所述输入数据的压缩包包括全基因组上游分析结果文件,展示的所述输入数据包括Snp数据及Indel数据;常规分析模块,用于对读取的输入数据进行常规分析;拓展分析模块,用于对读取的输入数据进行拓展分析;结果输出模块,用于对进行常规分析及拓展分析的输入数据,进行结果输出。相比现有技术,本发明专利技术解决了了现有全基因测序数据的下游分析是在R平台实现的,对于大多数没有学习过R语言的人来说是比较困难的,因此不利于用户对全基因组的下游分析的问题。问题。问题。

【技术实现步骤摘要】
一种基于R平台的全基因下游分析工具


[0001]本申请涉及基因分析工具
,特别是涉及一种基于R平台的全基因下游分析工具。

技术介绍

[0002]第二代测序技术又称为下一代测序技术也称为高通量测序,是对第一代测序技术的划时代变革的核心。其开创性的引入了可逆终止末端,从而实现边合成边测序,在DNA复制过程中通过捕捉新添加的碱基所携带的特殊标记来确定DNA序列。二代测序有高通量、读长短两个重要特点。
[0003]基于第二代测序技术的全基因组技术极大了推进了快速的全基因组DNA序列分析以及基因分型,能够快速、低成本的确定生物体的完整基因组序列,分析不同个体间的差异,同时完成SNP及基因组结构注释。全基因组测序由于结果包含完整丰富的信息,可以得到外显子测序或靶向测序不能得到的更多信息,具有其独特的优势。且随着近年来测序技术的不断进步、测序成本的不断降低,使得全基因组测序变得触手可及。而且全基因组测序在鉴定单核苷酸变异(SNP)、插入和缺失突变(Indel)时更有优势,所以WGS分析逐渐成为了临床和基础研究的另一种选择。
[0004]然而,全基因组的测序数据的下游分析是在R平台实现的,对于大多数没有学习过R语言的人来说是比较困难的,因此不利于用户对全基因组的下游分析。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种基于R平台的全基因下游分析工具,以解决现有的全基因组的测序数据的下游分析是在R平台实现的,对于大多数没有学习过R语言的人来说是比较困难的,因此不利于用户对全基因组的下游分析的问题。
[0006]本专利技术实施例提供了一种基于R平台的全基因下游分析工具,所述工具包括:
[0007]数据读取及展示模块,用于对输入数据的压缩包进行解压、读取及展示;其中,所述输入数据的压缩包包括全基因组上游分析结果文件,展示的所述输入数据包括Snp数据及Indel数据;
[0008]常规分析模块,用于对读取的输入数据进行常规分析;所述常规分析包括Snp+Indel突变数统计、Snp Heatmap分析、Snp所有突变类型分析、Snp/Indel各样本重复交叉分析、以及Snp/Indel圈图分析;
[0009]拓展分析模块,用于对读取的输入数据进行拓展分析;所述拓展分析包括Snp/Indel突变位置分析、各分组样本突变基因统计分析、各分组样本突变基因统计热图分析、以及各分组样本突变基因GO/KEGG富集分析;
[0010]结果输出模块,用于对进行常规分析及拓展分析的输入数据,进行结果输出。
[0011]进一步地,所述Snp+Indel突变数统计包括:
[0012]将Snp数据及Indel数据分开统计分析,得到Snp数据及Indel数据中不同分组的样
本;
[0013]对Snp数据及Indel数据中不同分组的样本进行统计;
[0014]根据R平台中的事件响应函数将统计后的数据,进行第一web页面展示;其中,第一Web页面展示包括交互式参数设置部分、柱状图展示部分、以及对应数据展示部分。
[0015]进一步地,所述Snp Heatmap分析包括:
[0016]对Snp数据中不同实验组的重复样本的同类型突变取均值;
[0017]通过控件将取均值处理后的Snp数据进行第二Web页面展示;其中,第二Web页面展示包括热图参数设置部分、热图展示部分、以及热图数据展示部分。
[0018]进一步地,所述Snp所有突变类型分析包括:
[0019]将输入数据进行Snp数据分类及Indel数据分类;
[0020]对Snp数据中的不同分组的重复样本中的相同的突变类型进行取平均值并进行统计分析;
[0021]通过ggpubr包中的ggbarplot作图函数对取平均值处理后的Snp数据进行作图,并进行第一Web页面展示,所述第一Web页面展示包括参数设置部分、柱状图显示部分、以及数据显示部分。
[0022]进一步地,所述Snp/Indel各样本重复交叉分析包括:
[0023]对单个分组中重复样本的交叉数据进行统计分析;
[0024]利用R平台中Venn包中的Venn函数对数据进行分析,并进行第一Web页面展示,所述第一Web页面展示包括参数设置部分、柱状图显示部分、以及数据显示部分。
[0025]进一步地,所述Snp/Indel圈图分析包括:
[0026]在Snp数据及Indel数据中各样本重复交叉分析,分析完之后,对交叉数据中每百万区间的突变数进行统计;
[0027]选择分析数据的类型是Snp或Indel;
[0028]根据选择后所有实验分组的数据的在shiny平台的Server端进行统计分析,再利用circlize包进行作图分析,并进行第三Web页面展示;其中,第三Web页面展示包括参数设置部分、以及Circos图显示部分。
[0029]进一步地,所述Snp/Indel突变位置分析包括:
[0030]对Snp数据及Indel数据中突变数据的突变位置进行分析;
[0031]对不同位置上的不同实验组下的Snp数据及Indel数据中的突变进行分析与第一Web页面展示展示;其中,第一Web页面展示包括交互式参数设置部分、柱状图展示部分、以及对应数据展示部分。
[0032]进一步地,所述各分组样本突变基因统计分析包括:
[0033]对输入的每个分组样本数据进行分析,获取其中的突变基因;
[0034]对每个样本数据中的不同突变基因进行统计,并对统计结果进行第一Web页面展示展示;其中,第一Web页面展示包括交互式参数设置部分、柱状图展示部分、以及对应数据展示部分。
[0035]进一步地,所述各分组样本突变基因统计热图分析包括:
[0036]对每个样本数据中的不同突变基因进行统计之后的数据,进行感兴趣样本以及位置的筛选;
[0037]对每个样本的感兴趣位置的突变基因进行第二Web页面展示;其中,第二Web页面展示包括热图参数设置部分、热图展示部分、以及热图数据展示部分。
[0038]进一步地,所述各分组样本突变基因GO/KEGG富集分析包括:
[0039]对每个样本数据中的不同突变基因进行统计之后的数据,选择实验组与参考组;
[0040]在实验组及参考组中选取感兴趣样本及突变的位置,并通过GO/KEGG富集分析方法,对选择的感兴趣基因进行富集分析与第四Web页面展示;其中,第四Web页面展示包括数据的选择部分、富集方法及参数设置部分、富集通路结果图展示部分、以及富集结果数据展示部分。
[0041]上述基于R平台的全基因下游分析工具,包括数据读取及展示模块,用于对输入数据的压缩包进行解压、读取及展示;其中,所述输入数据的压缩包包括全基因组上游分析结果文件,展示的所述输入数据包括Snp数据及Indel数据;常规分析模块,用于对读取的输入数据进行常规分析;所述常规分析包括Sn本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于R平台的全基因下游分析工具,其特征在于,所述工具包括:数据读取及展示模块,用于对输入数据的压缩包进行解压、读取及展示;其中,所述输入数据的压缩包包括全基因组上游分析结果文件,展示的所述输入数据包括Snp数据及Indel数据;常规分析模块,用于对读取的输入数据进行常规分析;所述常规分析包括Snp+Indel突变数统计、Snp Heatmap分析、Snp所有突变类型分析、Snp/Indel各样本重复交叉分析、以及Snp/Indel圈图分析;拓展分析模块,用于对读取的输入数据进行拓展分析;所述拓展分析包括Snp/Indel突变位置分析、各分组样本突变基因统计分析、各分组样本突变基因统计热图分析、以及各分组样本突变基因GO/KEGG富集分析;结果输出模块,用于对进行常规分析及拓展分析的输入数据,进行结果输出。2.根据权利要求1所述的基于R平台的全基因下游分析工具,其特征在于,所述Snp+Indel突变数统计包括:将Snp数据及Indel数据分开统计分析,得到Snp数据及Indel数据中不同分组的样本;对Snp数据及Indel数据中不同分组的样本进行统计;根据R平台中的事件响应函数将统计后的数据,进行第一web页面展示;其中,第一Web页面展示包括交互式参数设置部分、柱状图展示部分、以及对应数据展示部分。3.根据权利要求1所述的基于R平台的全基因下游分析工具,其特征在于,所述Snp Heatmap分析包括:对Snp数据中不同实验组的重复样本的同类型突变取均值;通过控件将取均值处理后的Snp数据进行第二Web页面展示;其中,第二Web页面展示包括热图参数设置部分、热图展示部分、以及热图数据展示部分。4.根据权利要求1所述的基于R平台的全基因下游分析工具,其特征在于,所述Snp所有突变类型分析包括:将输入数据进行Snp数据分类及Indel数据分类;对Snp数据中的不同分组的重复样本中的相同的突变类型进行取平均值,并进行统计分析;通过ggpubr包中的ggbarplot作图函数对取平均值处理后的Snp数据进行作图,并进行第一Web页面展示,所述第一Web页面展示包括参数设置部分、柱状图显示部分、以及数据显示部分。5.根据权利要求1所述的基于R平台的全基因下游分析工具,其特征在于,所述Snp/Indel各样本重复交叉分析包括:对单个分组中重复样本的交叉数据进行统计分析;利用R平台中Venn包中的Venn函数...

【专利技术属性】
技术研发人员:周小青陈涛金银戈郑伟池玉娥汪金玲邹庆剑唐成程陈敏徐巨才陈静郭素琴赖良学
申请(专利权)人:五邑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1