一种检测高血压相关基因及基因功能分析的系统技术方案

技术编号:33655365 阅读:15 留言:0更新日期:2022-06-02 20:34
本发明专利技术公开了一种检测高血压相关基因及基因功能分析的系统。包括:基因预处理单元,用于对高血压基因表达数据进行预处理获得基因表达矩阵;基因样本分析单元,基于基因表达矩阵分析样本分布情况;基因差异分析单元,基于基因表达矩阵筛选发生显著变化的差异基因,获得基因差异矩阵;基因模块分析单元,基于基因表达矩阵通过加权基因共表达网络方法确定基因模块并筛选关键模块;Hub基因分析单元,用于筛选关键基因中的Hub基因;基因功能分析单元,用于对差异表达基因或基因模块进行功能富集分析及通路与基因关系的网络分析。本发明专利技术可以辅助不熟悉高血压基因相关数据库和分析流程的科研人员准确有效的发现与高血压等复杂疾病相关的基因与通路。病相关的基因与通路。病相关的基因与通路。

【技术实现步骤摘要】
一种检测高血压相关基因及基因功能分析的系统


[0001]本专利技术属于生物信息学与数据挖掘领域,具体涉及一种检测高血压相关基因及基因功能分析的系统。

技术介绍

[0002]高血压是全球高发病率与高死亡率的慢性疾病,是导致心血管患者死亡的重要因素。全球每年因心血管疾病死亡的人数大约1700万,其中50%以上是因高血压导致的。尽管医疗技术不断进步,但高血压还未实现有效的预防与治疗,患病率与死亡率仍处于上升趋势,病因至今尚未完全阐明。因此,需要更多工具与方法来鉴定与高血压相关的生物标志物。
[0003]目前,利用现有技术分析高血压基因表达数据已经成为临床研究的重要研究方式,数据分析的结果直接影响疾病的诊断。但是,从事高血压相关研究的科研人员很多不具备生物信息学背景,缺乏编程技能和统计学背景,且海量的数据资源虽然大多公开免费,但标准不同、质量层次不齐,不能直接使用,给科研人员带来极大不便,尽管已有一些程序或网站可以分析和可视化基因表达数据结果,但它们存在功能单一、操作复杂或需要一定编程能力等一些局限性。近年来基因组学研究表明,基因与基因以及相关表达产物之间存在着复杂的关系,基因表达的调控不是孤立的,它们之间相互调控、相互关联,形成相互作用的网络,因此,仅仅研究基因表达数据的单个基因或差异基因不能满足实际需求,如何发现更多新方法且可以辅助科研人员特别是无生物信息学背景的实验、临床人员有效的识别枢纽基因是目前的难题之一。

技术实现思路

[0004]为解决上问题,本专利技术基于R shiny平台构建集智能化识别差异性基因、基于网络原理识别高血压hub基因及可视化于一体的交互式应用系统。本专利技术能够辅助科研人员特别是无生物信息学背景的实验、临床人员进行准确有效的基因差异分析和基于加权基因共表达网络获取高血压网络标志物,对高血压生物标志物的发现实现精准诊断和治疗具有重要意义。
[0005]本专利技术提供一种检测高血压相关基因及基因功能分析的系统,包括:
[0006]基因预处理单元,用于对高血压基因表达数据进行校正与归一化等预处理获得基因表达矩阵;
[0007]基因样本分析单元,基于基因样本分析单元获得的基因表达矩阵对样本表达及分布情况进行可视化分析;
[0008]基因差异分析单元,基于基因样本分析单元获得的基因表达矩阵筛选表达发生显著变化的差异基因,获得基因差异矩阵,并对其进行可视化;
[0009]基因模块分析单元,基于基因样本分析单元获得的基因表达矩阵通过加权基因共表达网络方法确定基因模块,并筛选关键基因模块;
[0010]Hub基因分析单元,用于筛选关键基因模块中的Hub基因,并可视化Hub基因在不同分组中的表达情况;
[0011]基因功能分析单元,用于对差异表达基因或关键基因模块等基因进行功能富集分析,并进行通路与基因关系的网络分析。
[0012]所述基因预处理单元包括:
[0013]基因校正与归一化模块,采用limma包中的normalizeBetweenArrays()函数和log2()换上对经基因过滤模块后的基因表达矩阵进行归一化。
[0014]所述基因样本分析单元包括:
[0015]基因表达矩阵模块,用于展示经基因预处理单元后获得的基因表达数据矩阵,利用shiny包中renderDataTable()函数将基因表达数据矩阵动态显示,并通过javascript实现其排序、筛选等子功能;
[0016]箱线图模块,用于了解样本的表达情况,通过R语言boxplot()函数进行箱线图可视化样本的表达情况;
[0017]PCA分析模块,用于了解样本的分类情况,通过ggfortify包中的autoplot()函数进行PCA分析可视化样本的分组情况;
[0018]聚类图模块,用于了解样本的聚类情况,通过stats包中hclust()函数进行层次聚类可视化样本的聚类情况。
[0019]在本专利技术的一种检测高血压相关基因及基因功能分析的系统中,所述基因差异分析单元包括:
[0020]基因差异分析模块,用于对经基因预处理单元后获得的基因表达数据矩阵进行差异分析获得差异性基因,通过logFC绝对值的均值+2倍logFC绝对值的标准差获得差异倍数,通过FDR方法校正P值得到差异性基因的表达数据,通过表格动态展示差异性基因表达矩阵,与NCBI和geneCards数据库相结合,便于直接查询基因的生物学意义;
[0021]聚类热图模块,用于可视化样本和差异表达基因的全局表达量变化及其聚类关系;
[0022]火山图模块,用于可视化在不同样本中差异表达显著性的基因,获得上调基因与下调基因的数量。
[0023]在本专利技术的一种检测高血压相关基因及基因功能分析的系统中,所述基因模块分析单元包括:
[0024]样本聚类模块,用于可视化样本的聚类情况,判断是否有离群样本,并可以交互式删除离群样本;
[0025]软阈值模块,用于获取合适的软阈值β,可视化1

30之间阈值的分布情况,满足交互式设置最佳软阈值;
[0026]动态剪切树模块,用于确定基因模块,以动态剪切树法对基因进行划分,具有相似功能的基因划分为同一模块,然后将具有0.80以上相似性的模块进行合并,获得最终的模块;
[0027]模块相关性聚类热图模块,用于可视化模块之间的相关性;
[0028]基因拓扑图模块,用于可视化模块基因的之间的拓扑情况;
[0029]模块与表型相关性热图模块,用于可视化模块与表型相关性,作为筛选关键模块
的依据;
[0030]基因模块显著性模块,用于可视化各基因模块与表型关系,作为筛选关键模块的依据;
[0031]基因模块数据文件下载模块,用于以cytoscape可读的文件格式导出模块数据,从而可以输入到cytoscape软件中,通过cytohubb插件中MCC算法获得Top10枢纽基因。
[0032]在本专利技术的一种检测高血压相关基因及基因功能分析的系统中,所述Hub基因分析单元包括:
[0033]hub基因模块,用于筛选关键模块中的hub基因,通过cor()函数计算基因与模块关系(Modularmembership,MM)、基因与性状关系(GeneSignificance,GS)及通过WGCNA包的networkScrenning()函数计算与表型相关的p.Weighted,并通过FDR方法校正获得q.Weighted,界面默认情况下设置|MM|>0.8,|GS|>0.2,且p.Weighted<0.05时获得的基因为枢纽基因。为了使不同基因模块可以筛选出最佳的枢纽基因,界面可以交互式设置这三个参数的阈值。
[0034]基因箱线图模块,用于以箱线图形状可视化基因在不同分组中的表达情况;
[0035]小提琴图模块,用于以小提琴形状可视化基因在不同分组中的表达情况。
[0036]在本专利技术的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测高血压相关基因及基因功能分析的系统,其特征在于,该系统的基因预处理单元生成的基因表达矩阵,首先传输到基因样本分析单元对数据进行可视化分析,然后传输到基因差异分析单元进行基因表达差异分析,再将基因差异分析单元生成的差异表达基因传输到基因功能分析单元;或者将基因样本分析单元输出的数据传输到基因模块分析单元用于确定基因模块和筛选关键基因模块,再将关键基因模块传输到Hub基因分析单元和基因功能分析单元;基因预处理单元,用于对高血压基因表达数据进行校正与归一化预处理获得基因表达矩阵;基因样本分析单元,基于基因样本分析单元获得的基因表达矩阵对样本表达及分布情况进行可视化分析;基因差异分析单元,基于基因样本分析单元获得的基因表达矩阵筛选表达发生显著变化的差异基因,获得基因差异矩阵,并对其进行可视化;基因模块分析单元,基于基因样本分析单元获得的基因表达矩阵通过加权基因共表达网络方法确定基因模块,并筛选关键基因模块;Hub基因分析单元,用于筛选关键基因模块中的Hub基因,并可视化Hub基因在不同分组中的表达情况;基因功能分析单元,用于对差异表达基因或关键基因模块等基因进行功能富集分析,并进行通路与基因关系的网络分析。2.如权利要求1所述一种检测高血压相关基因及基因功能分析的系统,其特征在于,所述的差异基因分析单元,筛选差异表达基因的差异倍数,是通过logFC绝对值的均值+2倍logFC绝对值的标准差获得的,通过FDR方法校正P值得到差异性基因的表达数据,并将差异表达基因与NCBI和geneCards数据库相结合,便于直接查询差异基因的生物学意义。3.如权利要求1所述一种检测高血压相关基因及基因功能分析的系统,其特征在于,所述基因模块分析界面中基因模块的确实和关键模块的筛选是基于加权基因共表达网络方法实现的,同时此界面可以实现交互式删除离群样本;交互式设置构建加权基因共表达网络的总基因数量、构建共表达网络的最佳软阈值、最小模块包含的基因数量;交互式设置表格的下载格式;交互式设置图片的下载大小和格式。4.如权...

【专利技术属性】
技术研发人员:李宗瑾吴晓明王志刚宋长新田立勤燕成英杨继玉贾泽宇
申请(专利权)人:青海师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1