一种评估患病风险的方法及其应用技术

技术编号:38824986 阅读:17 留言:0更新日期:2023-09-15 20:04
本发明专利技术涉及一种评估患病风险的方法及其应用,涉及生物信息学技术领域。该方法通过将全基因组和cDNA的测序数据整合,构建多元线性回归模型,从而评估关联疾病的患病风险。同时,该方法挖掘了潜在的与关联疾病强相关的基因,并将与关联疾病强相关基因的变异类型与关联疾病的患病风险相联系,丰富了评估维度,为医生和患者提供了更多的诊疗参考。生和患者提供了更多的诊疗参考。

【技术实现步骤摘要】
一种评估患病风险的方法及其应用


[0001]本专利技术涉及生物信息学
,特别是涉及一种评估患病风险的方法及其应用。

技术介绍

[0002]I型糖尿病又称胰岛素依赖型糖尿病,是一种慢性疾病,患者的胰腺几乎不产生胰岛素,其确切病因不明确,尚无彻底治愈的方法,常规治疗是通过注射胰岛素,控制饮食和生活方式来控制血糖水平,从而预防并发症。对I型糖尿病研究过程中发现,该疾病具有一定的遗传性,与免疫缺陷密切相关。
[0003]同时,在临床上,免疫缺陷一般有以下5大特点:1、较难控制:免疫缺陷的患者容易感染,且很难控制;2、类型差异:不同的免疫缺陷类型,患者感染的特点有所差异。如果以体液免疫为主要缺失,主要表现为化脓性细菌感染。如果以细胞免疫缺失为主要表现,感染的病原微生物通常为病毒、真菌,或者胞内寄生菌等;3、易发生肿瘤:免疫缺陷的患者容易发生肿瘤,尤其淋巴系统的肿瘤,如淋巴瘤等;4、易发生其他症状:免疫缺陷的患者可合并自身免疫性疾病,如红斑狼疮等结缔组织病,或有超敏反应,即病人容易过敏,出现过敏性鼻炎、哮喘。此外,部分患者可存在炎症状态;5、有遗传倾向:免疫缺陷通常有一定遗传倾向,可为常染色体显性,或隐性遗传。因此,免疫缺陷也是临床上值得重视的一类临床综合征。
[0004]因此,已确诊患有I型糖尿病的患者需要密切关注其免疫缺陷类疾病的易感性风险,若能预先评估、筛查,则能够为医生和患者提供更多的诊疗参考。

技术实现思路

[0005]针对上述问题,本专利技术提供一种评估患病风险的方法,该方法通过将全基因组和cDNA的测序数据整合,构建多元线性回归模型,从而评估关联疾病的患病风险。同时,该方法挖掘了潜在的与关联疾病强相关的基因,并将与关联疾病强相关基因的变异类型与关联疾病的患病风险相联系,丰富了评估维度,为医生和患者提供了更多的诊疗参考。
[0006]为了达到上述目的,本专利技术提供一种评估患病风险的方法,
[0007]该方法由电子设备执行以下步骤:
[0008]S1:获取确诊疾病阳性样本的全基因组测序数据,与人类基因组进行比对,筛选得到确诊疾病阳性样本的SNP位点,采用全基因组关联分析对所述SNP位点与确诊疾病进行分析,得到该确诊疾病的关联基因;
[0009]S2:获取所述确诊疾病阳性样本的cDNA测序数据,与人类基因组进行比对,得到确诊疾病所有被表达基因的表达矩阵;
[0010]S3:获取待评估关联疾病基因数据库数据,得到待评估关联疾病的关联基因,对所述确诊疾病的关联基因、所述待评估关联疾病的关联基因和所述表达矩阵中被表达基因取交集,得到强相关基因,并结合所述表达矩阵中相应基因表达量,得到强相关基因表达量;
[0011]S4:采用BLOSUM矩阵对所述强相关基因内的SNP位点进行评分,得到各SNP位点的
BLOSUM矩阵值;
[0012]S5:以所述强相关基因表达量和该强相关基因对应SNP位点的BLOSUM矩阵值为变量,构建多元线性回归模型,并以该确诊疾病对照样本对应的强相关基因表达量和对应SNP位点的BLOSUM矩阵值为基准,分析该确诊阳性样本对于待评估关联疾病的患病风险。
[0013]上述方法为一种非用于疾病诊断的评估患病风险的方法,通过将全基因组和cDNA的测序数据整合,构建多元线性回归模型,从而评估关联疾病的患病风险。同时,该方法挖掘了潜在的与关联疾病强相关的基因,并将与关联疾病强相关基因的变异类型与关联疾病的患病风险相联系,丰富了评估维度,为医生和患者提供了更多的诊疗参考。
[0014]在其中一个实施例中,所述全基因组测序数据和cDNA测序数据均来源于宏基因组测序数据中的人源数据。
[0015]宏基因组(Metagenomics)也称元基因组,是指特定环境下微生物群体基因组的总和。利用新一代高通量测序技术(NGS)以宏基因组为研究对象,可在分析微生物多样性、种群结构、进化关系的基础上,进一步探究微生物群体功能活性、相互协作关系及与环境之间的关系,发掘潜在的生物学意义。与传统微生物研究方法相比,宏基因组测序技术规避了绝大部分微生物不能培养、痕量菌无法检测的缺点,近年来广泛应用于微生物相关临检和科研上。在体外诊断领域,常见的样本类型包括血液、体液和组织等,在对该类样本进行宏基因组测序后,结果中除了微生物数据外不可避免地包含大量人类基因组数据(以下统称为人源数据),如何利用这些人源数据为医生和患者提供更多的诊疗信息是当前该领域的的研究热点。前期研究中,尝试了使用人源数据检测拷贝数变异(Copy number variation,CNV,指长度1KB以上的基因组大片段的拷贝数增加或者减少)。除了CNV之外,人类基因组还有大量的单核苷酸水平的变异,这种变异是生物多样性的体现以及进化的分子基础,又被称为单核苷酸多态性(SNP,Single Nucleotide Polymorphism),而SNP又与部分疾病的发展和发生有关联。上述方法有效利用了宏基因组测序数据中的人源部分,提高了人源部分的宏基因组测序数据的利用率。
[0016]在其中一个实施例中,S1步骤中,所述全基因组关联分析包括以下步骤:
[0017]采用遗传平衡定律与卡方检验分析所述SNP位点,得到连锁不平衡SNP位点,根据所述连锁不平衡SNP位点对应的概率P值,得到与疾病表型或疾病强相关的连锁不平衡SNP位点,该连锁不平衡SNP位点对应的基因,即为该确诊疾病的关联基因。上述连锁不平衡SNP位点的

log10(P)值越大,则连锁不平衡SNP位点与疾病表型或疾病的相关性越高。
[0018]在其中一个实施例中,所述表达矩阵包括被表达基因及各确诊疾病阳性样本被表达基因对应的表达量。
[0019]在其中一个实施例中,所述多元线性回归模型如下:
[0020][0021]其中,
[0022]Y为多元线性回归的观测值,
[0023]m为强相关基因的个数,
[0024]t
m
为第m个强相关基因的SNP位点总数,
[0025]k
m
为第m个强相关基因的第k
m
个SNP位点,
[0026]B
km
为第m个强相关基因的第k
m
个SNP位点对应的BLOSUM矩阵值,
[0027]E
m
为所述确诊疾病阳性样本的第m个强相关基因的表达量,
[0028]λ
m
为多元线性回归系数,
[0029]e为多元线性回归的残差。
[0030]上述k
m
为连加符号中的标记;e表示的多元线性回归的残差;E
m
为所有确诊疾病阳性样本的第m个强相关基因的表达量,是一个向量。本专利技术人采用多元线性回归模型并引入BLOSUM矩阵,将氨基酸的变化作为一个因素引入常规的多元线性回归模型中,使最终得到的模型包含了更多的信息,进而使该评估患病风险方法的效果更优。...

【技术保护点】

【技术特征摘要】
1.一种评估患病风险的方法,其特征在于,该方法由电子设备执行以下步骤:S1:获取确诊疾病阳性样本的全基因组测序数据,与人类基因组进行比对,筛选得到确诊疾病阳性样本的SNP位点,采用全基因组关联分析对所述SNP位点与确诊疾病进行分析,得到该确诊疾病的关联基因;S2:获取所述确诊疾病阳性样本的cDNA测序数据,与人类基因组进行比对,得到确诊疾病所有被表达基因的表达矩阵;S3:获取待评估关联疾病基因数据库数据,得到待评估关联疾病的关联基因,对所述确诊疾病的关联基因、所述待评估关联疾病的关联基因和所述表达矩阵中被表达基因取交集,得到强相关基因,并结合所述表达矩阵中相应基因表达量,得到强相关基因表达量;S4:采用BLOSUM矩阵对所述强相关基因内的SNP位点进行评分,得到各SNP位点的BLOSUM矩阵值;S5:以所述强相关基因表达量和该强相关基因对应SNP位点的BLOSUM矩阵值为变量,构建多元线性回归模型,并以该确诊疾病对照样本对应的强相关基因表达量和对应SNP位点的BLOSUM矩阵值为基准,分析该确诊阳性样本对于待评估关联疾病的患病风险。2.根据权利要求1所述的方法,其特征在于,所述全基因组测序数据和cDNA测序数据均来源于宏基因组测序数据中的人源数据。3.根据权利要求1所述的方法,其特征在于,S1步骤中,所述全基因组关联分析包括以下步骤:采用遗传平衡定律与卡方检验分析所述SNP位点,得到连锁不平衡SNP位点,根据所述连锁不平衡SNP位点对应的概率P值,得到与疾病表型或疾病强相关的连锁不平衡SNP位点,该连锁不平衡SNP位点对应的基因,即为该确诊疾病的关联基因。4.根据权利要求1所述的方法,其特征在于,所述表达矩阵包括被表达基因及各确诊疾病阳性样本被表达基因对应的表达量。5.根据权利要求1所述的方法,其特征在于,所述多元线性回归模型如下:其中,Y为多元线性回归的观测值,m为强相关基因的个数,t
m
为第m个强相关基因的SNP位点总数,k
m
为第m个强相关基因的第k
m
个SNP位点,B
km
为第m个强相关基因的第k
m
个SNP位点对应的BLOSUM矩阵值,E
m
为所述确诊疾病阳性样本的第m个强相关基因的表达量,λ
m
为多元线性回归系数,e为多元线性回归的残差。6.根据权利要求5所述的方法,其特征在于,以风险系数Risk作为评估确诊阳性样本...

【专利技术属性】
技术研发人员:余艳彭千袁悉奥唐春燕苏洁琼代冰
申请(专利权)人:长沙金域医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1