用于基于不一致性度量根据生物数据的亚群检测的方法、系统和装置制造方法及图纸

技术编号：20023471 阅读：24 留言：0更新日期：2019-01-06 03:21

公开了用于检测至少一种生物有机体的成分的亚群的方法、系统和装置。根据示范性实施例，根据至少一种生物有机体的成分汇编的生物数据样本的集群分区通过基于不一致性度量计算针对所述分区的不一致性得分来评估(114)。另外，针对多个分区中的至少一个，非零值被分配给仅具有一个生物数据样本的至少一个集群的所述不一致性度量。此外，所述亚群通过选择具有最小不一致性得分的分区作为所述亚群来识别。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于基于不一致性度量根据生物数据的亚群检测的方法、系统和装置
本文描述的各种实施例总体上涉及生物医学信息学技术。更具体地但非排他性地，本文公开的各种方法、系统和装置涉及生物信息学和基于生物数据对亚群的检测。
技术介绍
生物信息学技术提供了用于分析生物有机体的有效手段，并且是若干生物领域的重要方面。特别地，生物信息学技术过程已经在基因组学以及对包括癌症的疾病的研究和处置方面取得了重大进展。癌症以及其他基因组疾病的特征在于支持从正常细胞到肿瘤细胞的演变的基因组结构变异和基因表达的异种模式。出于临床研究的目的，并且特别是出于在肿瘤发展和增殖中识别驾驶员和乘客事件的目的，从可用基因组数据解读并表征独特模式的能力具有高度重要性。
技术实现思路
目前可用的生物医学信息学和生物信息学技术的有效性相对有限，因为这些技术所采用的分析不能提供用于确定生物数据中的亚组或亚群的数量的确定且准确的手段。例如，基因图谱的复杂性和体积使得很难有效且准确地分析它们以便检测各种亚群，包括例如基于对整个肿瘤活组织检查的分析的癌症患者的同种亚组以及反映肿瘤细胞谱系和演变的克隆群体，以及异常、正常和疾病特异性细胞系的群体。本公开涉及用于检测至少一种生物有机体的成分的亚群的方法、系统和装置。应用机器学习技术来发现这些类型的亚群是有问题的，因为数据内的类的数量通常是未知的。虽然非参数无监督式机器学习方法非常擅长检测个体样本的接近度并确定主要亚组(集群)的结构，但是它们无法提供正确数量的类的明确指示，而参数方法假设类的数量是事先知道的，这种情况很少发生。为了在保持高准确度的同时提高亚群的检测的效率，能够对...

【技术保护点】
1.一种用于检测至少一种生物有机体的成分的亚群的系统(100)，包括：至少一个硬件处理器(105)，其被配置为获得所述至少一种生物有机体的所述成分的生物数据样本的多个分区，所述多个分区中的每个分区定义所述成分的所述生物数据样本的各自数量的集群；以及非瞬态存储介质(108)，其被配置为存储所述多个分区，其中，所述至少一个硬件处理器(105)还被配置为针对所述多个分区中的每个分区基于对集群内不一致性进行测量的不一致性度量来计算针对对应分区的不一致性得分，其中，针对所述多个分区中的至少一个，非零值被分配给仅具有一个生物数据样本的至少一个集群的所述不一致性度量，并且其中，分区评估模块还被配置为确定所述多个分区中的哪个分区具有最小不一致性得分，并且通过选择所述多个分区中具有所述最小不一致性得分的分区作为所述亚群来识别所述至少一种生物有机体的所述成分的所述亚群。

【技术特征摘要】
【国外来华专利技术】2016.05.19 US 62/338,5511.一种用于检测至少一种生物有机体的成分的亚群的系统(100)，包括：至少一个硬件处理器(105)，其被配置为获得所述至少一种生物有机体的所述成分的生物数据样本的多个分区，所述多个分区中的每个分区定义所述成分的所述生物数据样本的各自数量的集群；以及非瞬态存储介质(108)，其被配置为存储所述多个分区，其中，所述至少一个硬件处理器(105)还被配置为针对所述多个分区中的每个分区基于对集群内不一致性进行测量的不一致性度量来计算针对对应分区的不一致性得分，其中，针对所述多个分区中的至少一个，非零值被分配给仅具有一个生物数据样本的至少一个集群的所述不一致性度量，并且其中，分区评估模块还被配置为确定所述多个分区中的哪个分区具有最小不一致性得分，并且通过选择所述多个分区中具有所述最小不一致性得分的分区作为所述亚群来识别所述至少一种生物有机体的所述成分的所述亚群。2.根据权利要求1所述的系统，其中，所述至少一个硬件处理器(105)还被配置为根据对应集群中的生物数据样本的总数和所述至少一种生物有机体的所述成分的生物数据样本的总数来对所述对应分区中的集群的至少子集中的每个集群的所述不一致性度量进行加权。3.根据权利要求1所述的系统，其中，所述至少一个硬件处理器(105)被配置为通过将所述至少一种生物有机体的所述成分的所述生物数据样本的不一致性度量作为一个整体进行加权来确定所述非零值。4.一种用于检测至少一种生物有机体的成分的亚群的方法(200)，所述方法由至少一个硬件处理器实施并且包括：获得(210)所述至少一种生物有机体的所述成分的生物数据样本的多个分区，所述多个分区中的每个分区定义所述成分的所述生物数据样本的各自数量的集群；针对所述多个分区中的每个分区，基于对集群内不一致性进行测量的不一致性度量来计算(218)针对对应分区的不一致性得分，其中，针对所述多个分区中的至少一个，非零值被分配(216)给仅具有一个生物数据样本的至少一个集群的所述不一致性度量；确定(219)所述多个分区中的哪个分区具有最小不一致性得分；并且通过选择所述多个分区中具有所述最小不一致性得分的分区作为所述亚群来识别(221)所述至少一种生物有机体的所述成...

【专利技术属性】
技术研发人员：K·沃良斯基，N·迪米特罗娃，Y·毛，
申请(专利权)人：皇家飞利浦有限公司，
类型：发明
国别省市：荷兰,NL

全部详细技术资料下载我是这个专利的主人