基因型判定装置及方法制造方法及图纸

技术编号:16934808 阅读:18 留言:0更新日期:2018-01-03 05:12
本发明专利技术提供使用了DNA微阵列的基因型判定技术中提高基因型的判定精度的基因型判定装置及方法。一个实施方式的基因型判定装置具备代表值算出部、第1标记部、模型构建部、第2标记部。代表值算出部对于基于多个SNP的多个检体信号强度分类的每个SNP的检体的簇,根据信号强度,算出各簇的代表值。第1标记部根据各簇的代表值,将基因型分配在分类为3个簇的SNP的各簇中。模型构建部构建表示分类为3个簇的SNP的各簇的基因型与代表值的关系的模型。第2标记部根据各簇的代表值及模型,将基因型分配在分类为1个或2个簇的SNP的各簇中。

Genotypic determination device and method

The present invention provides a genotypic determination device and method for improving the determination accuracy of the genotypes in the gene type determination technique of DNA microarrays. A genotypic determination device for an implementation method has a representative value calculation unit, a first marking part, a model building section, and a second marking part. The representative value calculates the cluster of each SNP for each SNP based on the strength of multiple sample signals, and calculates the representative values of each cluster according to the signal strength. According to the representative values of each cluster, the first labelled part assigns the genotypes to the clusters of SNP, which are classified into 3 clusters. The model building department constructs the model of the relationship between the genotypes and the representative values of the clusters of SNP, which are classified as 3 clusters. According to the representative values and models of each cluster, the second labelled Department assigns the genotypes to the clusters of SNP, which are classified into 1 or 2 clusters.

【技术实现步骤摘要】
【国外来华专利技术】基因型判定装置及方法
本专利技术的实施方式涉及基因型判定装置及方法。
技术介绍
生物将遗传信息作为基因组碱基序列(DNA)保持,同一生物种中,碱基序列的大部分是一致的。但是,将碱基序列的一部分在个体间不同、特别是在同一生物种的群体中碱基以1%以上的频率不同的基因位点称作单核苷酸多态性(SNP)。如人那样具有2条染色体的生物(二倍体的生物)中,由于SNP中的碱基差异,会产生3种组合模式。将这样的组合模式称作基因型。根据SNP的基因型,在同一生物种之间也会产生健康状态等的个体差异,因此基因型与遗传病或药效、药物副作用相关。因而,通过研究某个个体的特定的SNP的基因型,可以在给药前预测药效、副作用。为了发现与遗传病或药效、药物副作用相关的基因型,在人的情况下,需要一次对数十万个~数百万个SNP的基因型进行判定。作为能够实现其的基因型判定方法,可举出利用DNA微阵列的方法。该方法中,首先利用DNA微阵列使阵列侧的SNP的已知碱基序列与欲判定基因型的生物(检体)的未知碱基序列杂交,测定信号强度。接着,将同一SNP中测定的多个检体的信号强度投影到平面上,在各个SNP中,分类成同一基因型的簇。此外,使用生物学的知识,分配(标记)各簇的基因型。由此,可以一次性地对多个检体的同一SNP的基因型进行判定。但是,上述现有的方法中,由于未考虑到因温度或湿度等实验环境所导致的信号强度的偏移,因此有时会将基因型分配在错误的簇中。由此,存在被判定为错误的基因型的SNP增加、基因型的判定精度降低的问题。现有技术文献专利文献专利文献1:美国专利申请公开第2008/0287308号说明书专利
技术实现思路
专利技术要解决的技术问题本专利技术提供在使用了DNA微阵列的基因型判定技术中提高基因型的判定精度的基因型判定装置及方法。用于解决技术问题的方法一个实施方式的基因型判定装置具备代表值算出部、第1标记部、模型构建部和第2标记部。代表值算出部对于基于通过DNA微阵列所测量的多个SNP的多个检体的信号强度分类的每个SNP的检体的簇,根据各簇所含的检体的信号强度,算出各簇的代表值。第1标记部根据各簇的代表值,将基因型分配在SNP中分类为3个簇的SNP的各簇中。模型构建部构建表示SNP中分类为3个簇的SNP的各簇的基因型与各簇代表值的关系的模型。第2标记部根据各簇的代表值及模型,将基因型分配在SNP中分类为1个或2个簇的SNP的各簇中。附图说明图1为表示DNA微阵列的概略图。图2为说明DNA微阵列的动作的图。图3为表示标绘在信号强度平面上的检体之一例的图。图4为说明各基因型的簇的位置关系的图。图5为说明检体的分布偏移的图。图6为说明因检体的分布偏移所造成的影响的图。图7为说明利用第1实施方式的基因型判定装置的基因型判定方法的概要的图。图8为说明利用第1实施方式的基因型判定装置的基因型判定方法的概要的图。图9为表示第1实施方式的基因型判定装置的功能模块图。图10为表示信号强度数据之一例的图。图11为表示信号强度数据之一例的图。图12为表示簇数据之一例的图。图13为表示标绘在转换信号强度平面上的检体之一例的图。图14为表示转换信号强度数据之一例的图。图15为表示转换信号强度数据之一例的图。图16为表示代表值数据之一例的图。图17为表示概率分布模型之一例的图。图18为说明利用了概率分布模型的基因型分配方法的图。图19为表示基因型的判定结果之一例的图。图20为表示第1实施方式的基因型判定装置的硬件构成的图。图21为概略地表示利用第1实施方式的基因型判定装置的基因型判定处理的流程图。图22为表示代表值的算出处理的流程图。图23为表示信号强度数据的提取方法的图。图24为说明代表值的算出方法的图。图25为表示3簇的SNP的代表值数据之一例的图。图26为表示2簇的SNP的代表值数据之一例的图。图27为表示1簇的SNP的代表值数据之一例的图。图28为表示基因型在3簇SNP中的分配处理的流程图。图29为说明基因型在3簇SNP中的分配方法的图。图30为表示基因型在3簇SNP中的分配结果之一例的图。图31为说明在簇数据中的分配结果的应用方法的图。图32为说明在代表值数据中的分配结果的应用方法的图。图33为表示所更新的代表值数据之一例的图。图34为表示概率分布模型的构建处理的流程图。图35为说明代表值的提取方法的图。图36为表示概率分布模型之一例的图。图37为表示基因型在1、2簇SNP中的分配处理的流程图。图38为说明基因型在1、2簇SNP中的分配方法的图。图39为表示基因型在1、2簇SNP中的分配结果之一例的图。图40为表示第2实施方式的基因型判定装置的功能模块图。图41为表示利用第2实施方式的基因型判定装置的再分配处理的流程图。图42为说明利用第2实施方式的基因型判定装置的分配方法A的图。图43为说明利用第2实施方式的基因型判定装置的分配方法B的图。图44为说明利用第2实施方式的基因型判定装置的分配方法C的图。图45为说明利用第2实施方式的基因型判定装置的分配方法D的图。图46为说明利用第3实施方式的基因型判定装置的分配方法A的图。图47为说明利用第3实施方式的基因型判定装置的分配方法B的图。图48为说明利用第3实施方式的基因型判定装置的分配方法C的图。图49为表示显示装置中显示的画面之一例的图。图50为表示显示装置中显示的画面之一例的图。图51为表示显示装置中显示的画面之一例的图。图52为表示显示装置中显示的画面之一例的图。具体实施方式以下,参照附图对本专利技术的实施方式进行说明。首先,参照图1~图6说明使用了DNA微阵列的基因型判定技术的概要。图1为表示DNA微阵列的概略图。如图1所示,DNA微阵列具备多个检体分区。各检体分区与各检体相对应。各检体分区具备数十万~数百万的SNP分区。各SNP分区与各SNP相对应。各SNP分区具备由已知的碱基序列构成的2种探针A、B。探针是指用于在各SNP中捕获2种不同碱基的结构,各探针的SNP分区所对应的SNP的碱基不同。图1的例子中显示了SNP的碱基为A的探针及为C的探针。将检体的DNA应用于该SNP分区时,所对应的SNP的碱基为T的检体的DNA与碱基为A的探针杂交,碱基为G的检体的DNA与碱基为C的探针杂交。当检体的DNA与各探针杂交时,荧光强度或电流强度等信号强度发生变化。DNA微阵列每种探针地对该信号强度进行测量。以下,将一个探针称作探针A、将另一个探针称作探针B。另外,将强度对应于探针A的杂交而发生变化的信号称作信号A、将信号A的强度称作信号强度A。另外,将强度对应于探针B的杂交而发生变化的信号称作信号B、将信号B的强度称作信号强度B。这里,将SNPi的碱基为A的探针作为探针A、将碱基为C的探针作为探针B,如图2所示,当检体1的SNPi的基因型为TT时,在对应于SNPi的SNP分区中,大量的检体与探针A相杂交,信号强度A增大。如此,以下将信号强度A增大的基因型称作基因型AA。基因型AA为纯合子的基因型。另外,检体2的SNPi的基因型为TG时,在对应于SNPi的SNP分区中,同等程度的检体与探针A、B杂交,信号强度A、B变为同等程度。如此,以下将信号强度A、B为同等程度的基因型称作基因型AB。基因型AB为杂合子的基因型。此外,当检体本文档来自技高网
...
基因型判定装置及方法

【技术保护点】
一种基因型判定装置,其具备代表值算出部、第1标记部、模型构建部和第2标记部,所述代表值算出部对基于通过DNA微阵列所测量的多个SNP的多个检体的信号强度分类的每个所述SNP的检体的簇、根据所述各簇所含的检体的信号强度算出所述各簇的代表值;所述第1标记部根据所述各簇的代表值,将基因型分配在所述SNP中分类为3个簇的SNP的各簇中;所述模型构建部构建表示所述SNP中分类为3个簇的SNP的各簇的基因型与所述各簇的代表值的关系的模型;所述第2标记部根据所述各簇的代表值及所述模型,将基因型分配在所述SNP中分类为1个或2个簇的SNP的各簇中。

【技术特征摘要】
【国外来华专利技术】1.一种基因型判定装置,其具备代表值算出部、第1标记部、模型构建部和第2标记部,所述代表值算出部对基于通过DNA微阵列所测量的多个SNP的多个检体的信号强度分类的每个所述SNP的检体的簇、根据所述各簇所含的检体的信号强度算出所述各簇的代表值;所述第1标记部根据所述各簇的代表值,将基因型分配在所述SNP中分类为3个簇的SNP的各簇中;所述模型构建部构建表示所述SNP中分类为3个簇的SNP的各簇的基因型与所述各簇的代表值的关系的模型;所述第2标记部根据所述各簇的代表值及所述模型,将基因型分配在所述SNP中分类为1个或2个簇的SNP的各簇中。2.根据权利要求1所述的基因型判定装置,其中,所述信号强度是荧光强度或电流强度、或者基于它们的值转换得到的转换值。3.根据权利要求1或2所述的基因型判定装置,其中,所述代表值为所述簇所含的所述检体的回归直线的回归系数、所述回归系数的反正切、通过原点的近似直线的斜率、相关系数、簇中心值、簇中央值、簇方差、比的平均值或差的平均值。4.根据权利要求1~3中任一项所述的基因型判定装置,其中,所述第1标记部以所述簇的所述代表值的顺序分配一个纯合子的基因型、杂合子的基因型、另一个纯合子的基因型。5.根据权利要求1~4中任一项所述的基因型判定装置,其中,所述模型是服从每个所述基因型的所述代表值的概率分布的概率密度函数。6.根据权利要求5所述的基因型判定装置,其中,所述概率分布为混合高斯分布、正态分布、β分布或F分布。7.根据权利要求1~6中任一项所述的基因型判定装置,其中,所述第2标记部将所述代表值的概率密度最大的所述基因型分配在所述簇中。8.根据权利要求1~7中任一项所述的基因型判定装置,其进一步具备第3标记部,当将纯合型不同的所述基因型分别分配在分类为2个所述簇的所述SNP的所述各簇中时,所述第3标记部根据所述各簇的所述代表值将杂合型的所述基因型再分配于一个所述簇中。9.根据权利要求1~8中任一项所述的基因型判定装置,其进一步具备第3标记部,当将杂合型的所述基因型分别分配在分类为2个所述簇的所述SNP的所述各簇中时,所述第3标记部根据所述各簇的所述代表值将纯合型的所述基因型再分配于一个所述簇中。10.根据权利要求1~9中任一项所述的基因型判...

【专利技术属性】
技术研发人员:福岛亚梨花梅野真也
申请(专利权)人:株式会社东芝
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1