用于根据生物学数据的亚群检测的方法、系统和装置制造方法及图纸

技术编号:17310162 阅读:24 留言:0更新日期:2018-02-19 10:01
公开了用于检测至少一个生物学有机体的组成的亚群的方法、系统和装置。根据示范性实施例,将从至少一个生物学有机体的组成的群组编译的生物学数据形式化(112)为离散时间实值向量信号的集合。此外,对生物学数据的向量信号执行(114)频域分析以编译向量信号的谱性质。所述谱性质能够被用于有效地检测群组的亚群,同时维持高度的准确性。

Methods, systems and devices for subgroup detection based on biological data

Methods, systems and devices for detecting subgroups of the composition of at least one biological organism are disclosed. According to the exemplary embodiment, we will formalize biological data compiled from at least one biological organism's composition group (112) as a set of discrete real valued vector signals. In addition, the vector signals of biological data are performed (114) in frequency domain analysis to compile the spectral properties of the vector signals. The spectral properties can be used to detect the subgroups of the group effectively and maintain the accuracy of the height.

【技术实现步骤摘要】
【国外来华专利技术】用于根据生物学数据的亚群检测的方法、系统和装置
本专利技术总体涉及生物信息学技术。更具体地,在本文中所公开的各种创造性的方法、系统和装置涉及基于生物学数据对亚群的检测。
技术介绍
生物信息学技术提供了用于分析生物学有机体的有效手段,并且是若干生物学领域的重要方面。具体地,生物信息学技术过程已经在基因组学以及对包括癌症的疾病的研究和处置方面取得了重大进展。癌症以及其他基因组疾病的特征在于基因组结构变异和基因表达的异种模式,其支持从正常细胞向肿瘤细胞的演变。出于临床研究的目的,并且特别是在肿瘤发展和增殖中的驾驶员和乘客事件的识别,根据可用基因组数据来解读和表征独特模式的能力获得高度重视。用于推断肿瘤中的克隆群体结构的一种方法采用贝叶斯假设测试。该方法应用聚类流程,所述聚类流程将多组测序的体细胞突变分组成克隆聚类。
技术实现思路
基因简档的复杂性和容量使得非常难以出于检测各种亚群的目的而对其进行有效且准确地分析,所述亚群例如包括反映肿瘤细胞谱系和演变的克隆群体,以及异常、正常和疾病特异性细胞系的群体。本公开涉及用于检测至少一个生物学有机体的组成的亚群的专利技术方法、系统和装置。为了在维持高度准确性的同时提高对亚群的检测效率,根据本专利技术的一方面,将生物学数据形式化(formulate)为离散时间实值向量信号,并且使用一个或多个频域分析流程进行评估。在此,所述信号能够由基因组的特性来定义,其中,基因组的沿着基因组长度的区域能够被表示为时间值。此外,能够通过(一种或多种)频域分析流程来获得信号的谱性质,并且将其用作用于区分亚群的特征。因此,通过将生物学数据形式化为离散时间实值信号并且分析所述信号,能够以高效且准确的方式来检测亚群。此外,根据示范性方面,能够形成相异性指数以确定亚群。在此,能够识别包括群组成员的群体树的亲本-子本(parent-child)对,并且能够评估其相似性以构建相异性指数。所述相异性指数能够提供显著的优势,因为其能够通过亲本-子本对之间的高度可检测的显著差异来传达亚群,使得系统、方法和装置能够准确地检测亚群。一般而言,在一个方面中,一种示范性系统被配置为检测至少一个生物学有机体的组成的亚群。在此,所述系统由至少一个硬件处理器来实施,并且所述系统包括向量信号形式化模块、频域分析器、以及亚群检测模块。所述向量信号形式化模块被配置为将根据组成的群组而编译的生物学数据形式化为存储介质的至少一个数据结构内的离散时间实值向量信号的集合。此外,所述频域分析器被配置为对生物学数据的向量信号执行频域分析以编译向量信号的谱性质,并且被配置为将谱性质与群组的组成相关联。另外,所述亚群检测模块被配置为通过对所述谱性质应用相似性度量来识别一个或多个生物学有机体的亚群。所述亚群检测模块还被配置为引导对所识别的亚群的表示的显示。类似地,在另一方面中,一种示范性方法涉及检测至少一个生物学有机体的组成的亚群。所述方法能够由至少一个硬件处理器来实施。根据所述方法,根据组成的群组而编译的生物学数据被形式化为存储介质的至少一个数据结构内的离散时间实值向量信号的集合。此外,对所述生物学数据的向量信号执行频域分析以编译向量信号的谱性质。此外,使所述谱性质与群组的组成相关联。另外,通过对所述谱性质应用相似性度量来识别一个或多个生物学有机体的组成的亚群。根据示范性实施例,所述生物学数据包括基因组数据或蛋白质组数据中的至少一个。由于数据的复杂性和大小,系统、方法和装置实施例当被应用于基因组数据或蛋白质组数据时是尤其有利的。如上文所指出的,实施例能够本质上提高从数据中识别亚群的效率,同时维持高度的准确性。在示范性实施例的一个版本中,所述谱性质包括功率谱密度或总谱能量中的至少一个。所述功率谱密度和所述总谱能量提供了用于量化生物学数据中的方差的极好的手段,其能够被用于准确地检测不同性质以及亚群之间的差异。此外,在示范性实施例的一个版本中,所述生物学数据包括基因组数据,并且所述形式化还包括将基因组数据的基因组的区域形式化为时间值。将基因组的区域解释为时间值是分析基因组数据的完全不同的方法。此外,将基因组的区域形式化为时间值是配置数据的有效方式,从而能够采用频域分析技术来准确并且有效地识别亚群以及亚群之间的相异性程度。根据一个任选特征,所述基因组数据的至少一部分被形式化为不同基因组事件的至少一个线性组合。在此,将基因组事件形式化为线性组合提供了用于分析每个特定事件的方差的有效手段。例如,所述事件能够包括以下中的至少一项:拷贝数改变事件、突变、基因表达数据事件、或者甲基化数据事件。任选地,所述频域分析能够包括确定针对不同基因组事件的每个基因组事件的功率谱密度或总谱能量中的至少一个。分析特定基因组事件的方差能够用于评估克隆演变的特定模式以及识别患者可能遭受的侵袭和疾病类型。根据示范性实施例,对亚群体的所述识别能够包括构建群体树,所述群体树包括亲本-子本对,并且基于相似性度量来形成表示在所述对中的每个对的亲本(parent)与子本(child)之间的相异性的群体相异性指数。如上文所指出的,以这种方式形成相异性矩阵能够通过容易地检测亲本-子本对之间的显著差异来传达亚群。例如,对亚群的所述识别能够包括通过检测群体相异性指数的不同峰值的总数来确定亚群的总数。根据一个任选特征,对生物学数据的所述形式化包括对所述数据执行主成分分析以获得主成分。根据一个示范性特征,对其执行频域分析的所述向量信号能够包括主成分。所述主成分分析能够显著减少所分析的数据的量以确定亚群,从而能够提高方法、系统和装置实施例的效率。在生物学数据包括基因组数据的情况下,所述主成分能够表示基因组区域的线性组合,其继而识别展示亚群之间的最显著差异的基因组区域的组合。在另一任选特征中,对亚群的所述识别包括对向量信号和谱性质的组合执行聚类流程。在此,能够采用不同峰值的总数作为针对与亚群总数相对应的流程的高度截止。因此,所述聚类流程能够通过相异性指数所传达的不同差异来引导,由此提供用于检测亚群的准确且有效的手段。根据示范性实施例,能够显示所识别的亚群的表示。例如,所述表示能够包括所识别的亚群以及亚群内相似性和亚群间相异性的描述性特性。此外,在一个方面中,一种计算机可读介质包括计算机可读程序,所述计算机可读程序当在计算机上执行时使得所述计算机能够执行在本文中所描述的方法中的任何一种或多种方法。例如,所述计算机可读程序能够被配置为检测至少一个生物学有机体的组成的亚群,使得当所述程序在计算机上执行时,所述程序使计算机执行在本文中所描述的方法实施例中的任何一个或多个方法实施例的步骤。所述计算机可读介质能够是计算机可读存储介质或计算机可读信号介质。备选地或额外的,所述计算机可读介质能够包括计算机可读程序的更新或其他部分。如在本文中出于本公开的目的而使用的,术语“至少一个生物学有机体的组成”应当理解为包括但不限于:细胞、细胞系、细菌培养物、其他微生物或患者。术语生物学数据应当被理解为包括但不限于基因组数据,例如包括以下中的一个或多个:突变,全基因组拷贝数改变,基因和/或非编码RNA表达数据,DNA甲基化数据,组蛋白修饰,DNA绑定数据(例如,ChIPseq)和/或RNA绑定数据,和/或其他类型的基因组数据,蛋白质组数本文档来自技高网...
用于根据生物学数据的亚群检测的方法、系统和装置

【技术保护点】
一种用于检测至少一个生物学有机体的组成的亚群的系统(100),所述系统由至少一个硬件处理器来实施,并且所述系统包括:向量信号形式化模块(112),其被配置为将根据所述至少一个生物学有机体的所述组成的群组而编译的生物学数据形式化为存储介质(108)的至少一个数据结构内的离散时间实值向量信号的集合;频域分析器(114),其被配置为对所述生物学数据的所述向量信号执行频域分析以编译所述向量信号的谱性质,并且被配置为将所述谱性质与所述群组的所述组成相关联;以及亚群检测模块(118),其被配置为通过向所述谱性质应用相似性度量来识别所述至少一个生物学有机体的所述亚群,并且被配置为引导对所述识别的亚群的表示的显示。

【技术特征摘要】
【国外来华专利技术】2015.06.02 US 62/169,9021.一种用于检测至少一个生物学有机体的组成的亚群的系统(100),所述系统由至少一个硬件处理器来实施,并且所述系统包括:向量信号形式化模块(112),其被配置为将根据所述至少一个生物学有机体的所述组成的群组而编译的生物学数据形式化为存储介质(108)的至少一个数据结构内的离散时间实值向量信号的集合;频域分析器(114),其被配置为对所述生物学数据的所述向量信号执行频域分析以编译所述向量信号的谱性质,并且被配置为将所述谱性质与所述群组的所述组成相关联;以及亚群检测模块(118),其被配置为通过向所述谱性质应用相似性度量来识别所述至少一个生物学有机体的所述亚群,并且被配置为引导对所述识别的亚群的表示的显示。2.根据权利要求1所述的装置,其中,所述生物学数据包括基因组数据或蛋白质组数据中的至少一个。3.一种用于检测至少一个生物学有机体的组成的亚群的方法(200),所述方法由至少一个硬件处理器来实施,并且所述方法包括:将根据所述至少一个生物学有机体的所述组成的群组而编译的生物学数据形式化(204)为存储介质的至少一个数据结构内的离散时间实值向量信号的集合;对所述生物学数据的所述向量信号执行(206)频域分析以编译所述向量信号的谱性质;将所述谱性质与所述群组的所述组成相关联(208);并且通过向所述谱性质应用相似性度量来识别(210)所述至少一个生物学有机体的所述组成的所述亚群。4.根据权利要求3所述的方法,其中,所述生物学数据包括基因组数据或蛋白质组数据中的至少一个。5.根据权利要求4所述的方法,其中,所述谱性质包括功率谱密度或总谱能量中的至少一个。6.根据权...

【专利技术属性】
技术研发人员:K·沃良斯基N·迪米特罗娃
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1