性状预测模型制作方法和性状预测方法技术

技术编号:15919402 阅读:21 留言:0更新日期:2017-08-02 04:36
本发明专利技术提供一种用于由单核苷酸多态性数据预测性状的表现型的性状预测模型制作方法、以及能够以高的准确率预测性状的性状预测方法。即,一种性状预测模型制作方法,包括:使用在生物的多个个体中使多个单核苷酸多态性与形状对应的单核苷酸多态性数据,将多个单核苷酸多态性分别矩阵表示的工序;将多个单核苷酸多态性基于遗传结构分类为多个类别的工序;对于各个类别,使用矩阵表示和属于类别的单核苷酸多态性的个数计算基因组相似度矩阵的工序;和将基因组相似度矩阵和遗传结构的参数应用于线性混合模型的工序。

【技术实现步骤摘要】
【国外来华专利技术】性状预测模型制作方法和性状预测方法
本专利技术涉及一种性状预测模型制作方法和性状预测方法。
技术介绍
目前,作为使用人基因组信息的表现型预测,着眼于性状感受性多态性,集中研究了仅使用已经被鉴定的感受性多态性预测表现型的方法(V.Lyssenkoetal.,NEnglJMed2008vol.359p.2220-2232;S.Ripatthietal.,Lanet2010Vol.376p.1393-1400;C.A.Ibrahim-Verbaasetal.,Stroke2014vol.45p.403-412)。这些方法具体列举与性状相关的数个到数百个多态性,推定各个多态性的重要性,能够将各个多态性对性状的影响数值化,从这点上说,容易直观地理解。但是,仅使用感受性多态性这一点是该方法的缺点,是有限度的。这是因为在几乎全部的多因子性状中,在成为实际的原因的感受性多态性中被鉴定的感受性多态性极少。例如,推定能够由遗传因素说明身高的方差中的约80%,但是能够由已知的感受性多态性来说明的方差只不过为5%左右。因此,非专利文献(D.SpeedandD.J.Balding,GenomeResearch2015vol.24p.1550-1557)中记载了不管是不是感受性多态性都使用网罗性(全基因组)的多态性信息的表现型预测法。即,将多个单核苷酸多态性(SingleNucleotidePolymorphism;SNP)分解为多个类别(category),应用线性混合模型。但是,在该方法中,预测的精度也还不充分。
技术实现思路
专利技术所要解决的课题本专利技术的目的在于提供一种用于从单核苷酸多态性数据预测性状的表现型的性状预测模型制作方法和能够以高的准确率预测性状的性状预测方法。用于解决课题的方法本专利技术的专利技术人研究了不管是否为感受性多态性都使用网罗性(全基因组)的多态性信息的统计学处理方法。即,发现:以包含身高或HbAlc检查值的27个量的性状、和包含患有糖尿病或低HDL胆固醇血症的5个质的性状为例,将约100万个多态性作为基因组信息,将性别年龄信息用作调节变量,应用线性混合模型,对性状进行学习而制作预测模型,其结果,该预测与实测值存在高度地相关。这样,我们完成了从基因组信息预测表现型的预测方法。本专利技术的一个实施方式为一种性状预测模型制作方法,其使用在生物的多个个体中使多个单核苷酸多态性与形状对应的单核苷酸多态性数据,制作预测多因子性性状的表现型的预测模型,该性状预测模型制作方法包括:将上述多个单核苷酸多态性分别矩阵表示的工序;将上述多个单核苷酸多态性基于遗传结构分类为多个类别的工序;对于各个上述类别,使用上述矩阵表示和属于上述类别的上述单核苷酸多态性的个数计算基因组相似度矩阵的工序;和将上述基因组相似度矩阵和上述遗传结构的参数应用于线性混合模型的工序。上述遗传结构可以为效应量(effectsize)和/或等位基因频率(allelefrequency)。本专利技术的另一实施方式为一种性状预测模型制作方法,其使用在生物的多个个体中使多个单核苷酸多态性、性别、年龄与形状对应的单核苷酸多态性数据,制作预测多因子性性状的表现型的性状预测模型,该性状预测模型制作方法包括:将上述多个单核苷酸多态性分别矩阵表示的工序;将上述性别和/或年龄矩阵表示的工序;使用上述单核苷酸多态性的矩阵表示和上述单核苷酸多态性的个数计算基因组相似度矩阵的工序;和将上述基因组相似度矩阵、和上述性别和/或年龄的矩阵应用于线性混合模型的工序。上述性状可以选自身高、体重、最高血压、最低血压、血糖、HbAlc、红细胞数、血色素、血细胞容积、白细胞数、血小板数、嗜中性粒细胞的比例、淋巴细胞的比例、单核细胞的比例、嗜酸性粒细胞的比例、嗜碱性粒细胞的比例、大型不染色细胞的比例、AST(GOT)、ALT(GPT)、γ-GTP、总胆固醇、中性脂肪、HDL胆固醇、LDL胆固醇、肌酐、尿素氮、尿酸、糖尿病、高血压症、高LDL胆固醇血症、低HDL胆固醇血症、高甘油三酯血症。本专利技术的再一实施方式为一种性状预测方法,其在生物个体中从多个单核苷酸多态性数据预测该生物个体的性状,该性状预测方法包括:使用学习用数据集,按照上述预测模型制作方法制作预测模型的工序;确定线性混合模型的参数和潜在变量的工序;和将该生物个体的上述多个单核苷酸多态性数据应用于上述预测模型的工序。本专利技术的再一实施方式为一种用于在生物个体中从多个单核苷酸多态性数据预测该生物个体的性状的程序,其中,使计算机执行上述性状预测方法。本专利技术的一个实施方式可以为一种存储有本程序的计算机可读取的存储介质。本专利技术的再一实施方式为一种用于在生物个体中从多个单核苷酸多态性数据预测该生物个体的性状的性状预测系统,其具备:(i)用于输入上述生物个体的多个单核苷酸多态性数据的输入装置;(ii)使用输入的数据,执行上述程序的计算机;和(iii)用于输出由(ii)得到的结果的输出装置。==与关联文献的交叉引用==本申请主张基于在2014年11月25日申请的日本国专利申请2014-238252的优先权,通过引用该基础申请,包含在本说明书中。附图说明图1是表示在本专利技术的一个实施例中,着眼于HbAlc检查值和身高,利用遗传结构分解法的贡献率的推定结果的图(Qes=50、QRAF=1的情况)。图2是表示在本专利技术的一个实施例中,着眼于HbAlc检查值和身高,利用遗传结构分解法的贡献率的推定结果的图(Qes=1、QRAF=30的情况)。图3是在本专利技术的一个实施例中实施例中所使用的性状的一览。图4是表示在本专利技术的一个实施例中27个量的性状的精度评价结果的图。对(1)仅使用单核苷酸多态性信息、且Qes=1、QRAF=1的情况(没有遗传结构分解)、(2)仅使用性别·年龄信息的情况、(3)使用单核苷酸多态性信息和性别·年龄信息这两者、且Qes=1、QRAF=1的情况(没有遗传结构分解;本专利技术的实施例)这3种方法进行比较。作为评价指标,使用实测值和预测值的R2(相关系数的平方),利用二折交叉验证(2-foldcrossvalidation)法进行评价。图5是表示在本专利技术的一个实施例中5个质的性状的精度评价结果的图。对(1)仅使用单核苷酸多态性信息、且Qes=1、QRAF=1的情况(没有遗传结构分解)、(2)仅使用性别·年龄信息的情况、(3)使用单核苷酸多态性信息和性别·年龄信息这两者、且Qes=1、QRAF=1的情况(没有遗传结构分解;本专利技术的实施例)这3种方法进行比较。作为评价指标,使用AUC,利用二折交叉验证法进行评价。图6是表示在本专利技术的一个实施例中样本量充分大时27个量的性状的精度评价结果的图。对(1)仅使用单核苷酸多态性信息、且Qes=1、QRAF=1的情况(没有遗传结构分解)、(2)仅使用性别·年龄信息的情况、(3)使用单核苷酸多态性信息和性别·年龄信息这两者、且Qes=1、QRAF=1的情况(没有遗传结构分解;本专利技术的实施例)、(4)使用单核苷酸多态性信息和性别·年龄信息这两者、且Qes=10、QRAF=1的情况(有遗传结构分解;本专利技术的实施例)这4种方法进行比较。作为评价指标,使用实测值和预测值的R2(相关系数的平方),利用二折交叉验证法进行评价。图7是表示在本专利技术本文档来自技高网...
性状预测模型制作方法和性状预测方法

【技术保护点】
一种性状预测模型制作方法,其特征在于:使用在生物的多个个体中使多个单核苷酸多态性与形状对应的单核苷酸多态性数据,制作预测多因子性性状的表现型的预测模型,所述性状预测模型制作方法包括:将所述多个单核苷酸多态性分别矩阵表示的工序;将所述多个单核苷酸多态性基于遗传结构分类为多个类别的工序;对于各个所述类别,使用所述矩阵表示和属于所述类别的所述单核苷酸多态性的个数计算基因组相似度矩阵的工序;和将所述基因组相似度矩阵和所述遗传结构的参数应用于线性混合模型的工序。

【技术特征摘要】
【国外来华专利技术】2014.11.25 JP 2014-2382521.一种性状预测模型制作方法,其特征在于:使用在生物的多个个体中使多个单核苷酸多态性与形状对应的单核苷酸多态性数据,制作预测多因子性性状的表现型的预测模型,所述性状预测模型制作方法包括:将所述多个单核苷酸多态性分别矩阵表示的工序;将所述多个单核苷酸多态性基于遗传结构分类为多个类别的工序;对于各个所述类别,使用所述矩阵表示和属于所述类别的所述单核苷酸多态性的个数计算基因组相似度矩阵的工序;和将所述基因组相似度矩阵和所述遗传结构的参数应用于线性混合模型的工序。2.如权利要求1所述的性状预测模型制作方法,其特征在于:所述遗传结构为效应量和/或等位基因频率。3.一种性状预测模型制作方法,其特征在于:使用在生物的多个个体中使多个单核苷酸多态性、性别、年龄与形状对应的单核苷酸多态性数据,制作预测多因子性性状的表现型的预测模型,所述性状预测模型制作方法包括:将所述多个单核苷酸多态性分别矩阵表示的工序;将所述性别和/或年龄矩阵表示的工序;使用所述单核苷酸多态性的矩阵表示和所述单核苷酸多态性的个数计算基因组相似度矩阵的工序;将所述基因组相似度矩阵、和所述性别和/或年龄的矩阵应用于线性混合模型的工序。4.如权利要求3所述的性状预测模型制作方法,其特征在于:所述性状选自身高、体重、最高血压、最低血压、...

【专利技术属性】
技术研发人员:八谷刚史
申请(专利权)人:学校法人岩手医科大学
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1