使用基于树的空间数据结构对基因数据集的群体分类制造技术

技术编号:11331427 阅读:130 留言:0更新日期:2015-04-22 21:45
构建表示参考群体的参考基因数据集的参考特征向量。使用线性变换来对所述参考特征向量进行变换以生成所述参考群体的所述参考基因数据集的降低的维度的向量表示。构建基于树的空间数据结构以将所述参考基因数据集索引为数据点,所述数据点由所述参考群体的所述参考基因数据集的所述降低的维度的向量表示的至少一些维定义。可以通过对所述参考特征向量执行特征约简来生成所述线性变换。使用所述线性变换对表示先证者基因数据集的特征向量进行变换以生成降低的维度的向量表示,所述降低的维度的向量表示被定位在所述基于树的空间数据结构中以执行针对所述先证者基因数据集的群体分配。

【技术实现步骤摘要】
【国外来华专利技术】
下文总体上涉及基因分析领域、医学领域,并且涉及基因分析领域、医学领域的应用,例如包括肿瘤学领域、兽医学领域等的医学领域的应用。
技术介绍
能够使用诸如微阵列和“下一代”测序系统的技术来采集针对个体的大的基因数据集,其中,微阵列能够生成数万到数十万的基因数据点,例如,每个对应于目标蛋白等的表达水平,“下一代”测序系统能够输出构成数百万或更大基数的大的序列以及甚至整个基因组序列。根据这样的数据集,能够识别诸如单核苷酸多态性(SNP)、拷贝数变异(CNV)等的各种基因标记物,该基因标记物是医学检验的,例如指示特定类型的癌症。已知,对这样的基因标记物的解读通过按种族、性别或其他群体分组对个体的分类的知识得到促进或者在一些情况下需要按种族、性别或其他群体分组对个体的分类的知识。例如,基于群体,一些基因组变异体(注意,如本文中所使用的,“基因”和“基因组”被认为是可互换的)已经与超过一个不同的基因失调相关联。在一些情况下,等位基因在一个群体中是主要等位基因,而在另一个群体中是次要(以及疾病指示性)等位基因。因此,对于对基因变异体的适当解读而言,获知适当的群体是有用的或者甚至是必须的。在本文档来自技高网...

【技术保护点】
一种非暂态存储介质,其存储能由电子数据处理设备(10)运行以执行包括以下的方法的指令:对表示参考群体的基因数据集的特征向量执行特征约简以生成将所述特征向量映射到与所述特征向量的维度相比降低的维度的向量空间的映射;使用所述映射来生成所述参考群体的所述基因数据集的降低的维度的向量表示;并且将所述参考群体的所述基因数据集的所述降低的维度的向量表示存储为基于树的空间数据结构中的数据点。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:B·查克拉巴蒂P·穆尼亚帕S·库马尔R·辛格S·库马尔A·马特胡尔
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1