一种基于基因大数据的病症关联分析系统及方法技术方案

技术编号:34044583 阅读:17 留言:0更新日期:2022-07-06 14:18
本发明专利技术公开了一种基于基因大数据的病症关联分析系统及方法,涉及生物信息技术领域。包括共表达网络图模块、致病SNP组检测模块和病症关联模型生成模块;共表达网络图模块获取多个患有目标病症的用户的基因表达数据集;构建基因表达数据集的共表达网络图;致病SNP组检测模块根据共表达网络图确定目标病症的致病SNP组;病症关联模型生成模块将目标病症与致病SNP组之间的关联关系进行量化,得到目标病症的病症关联模型。通过基因表达数据集构建共表达网络图,进而确定目标病症的致病SNP组,可以量化目标病症与致病SNP组之间的关系,加强基因表达与病症之间的病症关联性。强基因表达与病症之间的病症关联性。强基因表达与病症之间的病症关联性。

A disease association analysis system and method based on gene big data

【技术实现步骤摘要】
一种基于基因大数据的病症关联分析系统及方法


[0001]专利技术涉及生物信息
,具体涉及一种基于基因大数据的病症关联分析系统及方法。

技术介绍

[0002]随着计算机科学和生命科学的深度融合,计算机相关技术越来越多的应用于海量生物数据的分析挖掘中。其中,病症关联性分析已经成为目前生物信息
的一个研究重点。
[0003]通过GWAS(Genome

wide Association Study,全基因组关联分析),可以分析不同个体SNP(Single Nucleotide Polymorphism,单核酸多态性)频率的差异,以确定一些可能的致病基因。
[0004]现有技术中,通常通过单个SNP位点与病症表型之间的关系,确定基因与病症之间的病症关联性。由于基因通常以交互方式而不是单独工作,因此,病症关联性往往与多个SNP位点的共同表达相关。导致病症关联性分析得出的结果中,基因表达与病症之间的病症关联性较弱。

技术实现思路

[0005]本专利技术的目的就在于解决上述
技术介绍
的问题,而提出一种基于基因大数据的病症关联分析系统及方法。
[0006]本专利技术的目的可以通过以下技术方案实现:本专利技术实施例第一方面,提供了一种基于基因大数据的病症关联分析系统,包括共表达网络图模块、致病SNP组检测模块和病症关联模型生成模块;其中:所述共表达网络图模块,用于获取多个患有目标病症的用户的基因表达数据集;构建所述基因表达数据集的共表达网络图;所述共表达网络图中的每一节点表示一个基因,每个边的邻接值表示两个基因之间的关联程度;所述致病SNP组检测模块,用于根据所述共表达网络图确定目标病症的致病SNP组;所述病症关联模型生成模块,用于将所述目标病症与所述致病SNP组之间的关联关系进行量化,得到所述目标病症的病症关联模型。
[0007]基于相同的专利技术构思本专利技术实施例第二方面,还提供了一种基于基因大数据的病症关联分析方法,所述方法包括:获取多个患有目标病症的用户的基因表达数据集;构建所述基因表达数据集的共表达网络图;所述共表达网络图中的每一节点表示一个基因,每个边的邻接值表示两个基因之间的关联程度;根据所述共表达网络图确定目标病症的致病SNP组;
将所述目标病症与所述致病SNP组之间的关联关系进行量化,得到所述目标病症的病症关联模型。
[0008]可选地,构建所述基因表达数据集的共表达网络图,包括:根据所述基因表达数据集确定每一基因的节点特征矩阵;根据每一基因的节点特征矩阵计算每两个基因间的加权邻接值,得到每一基因的边矩阵;根据每一基因的节点特征矩阵和边矩阵构建所述基因表达数据集的共表达网络图。
[0009]可选地,根据每一基因的节点特征矩阵计算每两个基因间的加权邻接值,得到每一基因的边矩阵,包括:每一基因的节点特征矩阵计算每两个基因间的邻接值;其中,和为所述基因表达数据集中的任意两个基因的节点特征矩阵,N表示所述基因表达数据集中的用户的数量,和表示该基因在所有用户中的平均特征;对所述邻接值进行加权,得到每两个基因间的加权邻接值,得到每一基因的边矩阵;其中为预设加权系数。
[0010]可选地,根据所述共表达网络图确定目标病症的致病SNP组,包括:聚合所述共表达网络图上相邻节点的特征提取基因模块组特征;所述基因模块组特征为具有相似基因表达的节点组合;使用预设致病SNP检测算法检测所述基因模块组特征,得到目标病症的致病SNP组。
[0011]可选地,将所述目标病症与所述致病SNP组之间的关联关系进行量化,得到所述目标病症的病症关联模型,包括:将所述基因表达数据集进行随机重采样,得到多个相同规模的重采样数据集;针对每一重采样数据集,求解所述致病SNP组的每一种SNP组合时患目标病症的概率,作为目标概率;将每一重采样数据集求解得到的目标概率进行平均,得到所述目标病症的病症关联模型。
[0012]可选地,针对每一重采样数据集,求解所述致病SNP组的每一种SNP组合时患目标病症的概率,作为目标概率,包括:根据预设决策树算法训练目标预测模型;
将所述致病SNP组的每一种SNP组合作为所述目标预测模型的输入,得到所述目标预测模型的输出为每一种SNP组合时患目标病症的概率,作为目标概率。
[0013]本专利技术实施例提供的一种基于基因大数据的病症关联分析系统,包括共表达网络图模块、致病SNP组检测模块和病症关联模型生成模块;共表达网络图模块,用于获取多个患有目标病症的用户的基因表达数据集;构建基因表达数据集的共表达网络图;共表达网络图中的每一节点表示一个基因,每个边的邻接值表示两个基因之间的关联程度;致病SNP组检测模块,用于根据共表达网络图确定目标病症的致病SNP组;病症关联模型生成模块,用于将目标病症与致病SNP组之间的关联关系进行量化,得到目标病症的病症关联模型。通过基因表达数据集构建共表达网络图,进而确定目标病症的致病SNP组,可以量化目标病症与致病SNP组之间的关系,加强基因表达与病症之间的病症关联性。
附图说明
[0014]下面结合附图对本专利技术作进一步的说明。
[0015]图1为本专利技术实施例提供的一种基于基因大数据的病症关联分析系统的系统框图。
[0016]图2为本专利技术实施例提供的一种基于基因大数据的病症关联分析方法的流程图。
[0017]图3为本专利技术实施例提供的另一种基于基因大数据的病症关联分析方法的流程图。
[0018]图4为本专利技术实施例提供的另一种基于基因大数据的病症关联分析方法的流程图。
具体实施方式
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0020]本专利技术实施例提供了一种基于基因大数据的病症关联分析系统。参见图1,图1为本专利技术实施例提供的一种基于基因大数据的病症关联分析系统的系统框图。该系统包括共表达网络图模块、致病SNP组检测模块和病症关联模型生成模块。
[0021]其中:共表达网络图模块,用于获取多个患有目标病症的用户的基因表达数据集;构建基因表达数据集的共表达网络图;共表达网络图中的每一节点表示一个基因,每个边的邻接值表示两个基因之间的关联程度;致病SNP组检测模块,用于根据共表达网络图确定目标病症的致病SNP组;病症关联模型生成模块,用于将目标病症与所述致病SNP组之间的关联关系进行量化,得到目标病症的病症关联模型。
[0022]基于本专利技术实施例提供的一种基于基因大数据的病症关联分析系统,通过基因表达数据集构建共表达网络图,进而确定目标病症的致病SNP组,可以量化目标病症与致病SNP组之间的关系,加强基因表达与病症之间的病症关联性。
[0023]基于相同的专利技术构思,本专利技术实施例还提供了一种基于基因大数据的病症关联分析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基因大数据的病症关联分析系统,其特征在于,包括共表达网络图模块、致病SNP组检测模块和病症关联模型生成模块;其中:所述共表达网络图模块,用于获取多个患有目标病症的用户的基因表达数据集;构建所述基因表达数据集的共表达网络图;所述共表达网络图中的每一节点表示一个基因,每个边的邻接值表示两个基因之间的关联程度;所述致病SNP组检测模块,用于根据所述共表达网络图确定目标病症的致病SNP组;所述病症关联模型生成模块,用于将所述目标病症与所述致病SNP组之间的关联关系进行量化,得到所述目标病症的病症关联模型。2.一种基于基因大数据的病症关联分析方法,其特征在于,所述方法包括:获取多个患有目标病症的用户的基因表达数据集;构建所述基因表达数据集的共表达网络图;所述共表达网络图中的每一节点表示一个基因,每个边的邻接值表示两个基因之间的关联程度;根据所述共表达网络图确定目标病症的致病SNP组;将所述目标病症与所述致病SNP组之间的关联关系进行量化,得到所述目标病症的病症关联模型。3.基于权利要求2所述的一种基于基因大数据的病症关联分析方法,其特征在于,构建所述基因表达数据集的共表达网络图,包括:根据所述基因表达数据集确定每一基因的节点特征矩阵;根据每一基因的节点特征矩阵计算每两个基因间的加权邻接值,得到每一基因的边矩阵;根据每一基因的节点特征矩阵和边矩阵构建所述基因表达数据集的共表达网络图。4.基于权利要求3所述的一种基于基因大数据的病症关联分析方法,其特征在于,根据每一基因的节点特征矩阵计算每两个基因间的加权邻接值,得到每一基因的边矩阵,包括:每一基因...

【专利技术属性】
技术研发人员:文妍谢杰梁丽敏
申请(专利权)人:广州盛安医学检验有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1