大型多参数数据集的可视化、比较分析和自动差异检测制造技术

技术编号:22569862 阅读:42 留言:0更新日期:2019-11-17 10:10
本文提供的方法的一些实施例涉及用于大型多参数数据集的样品分析和粒子表征方法。频率差选通对至少两个不同的数据集进行比较以根据定义的阈值标识多变量空间中来自第一数据集的事件的频率不同于来自第二数据集的事件的频率的区域。

Visualization, comparative analysis and automatic difference detection of large multi parameter data sets

Some embodiments of the methods provided herein relate to sample analysis and particle characterization methods for large multiparameter data sets. Frequency difference gate compares at least two different data sets to identify areas in the multivariable space where the frequency of events from the first data set is different from the frequency of events from the second data set based on a defined threshold.

【技术实现步骤摘要】
【国外来华专利技术】大型多参数数据集的可视化、比较分析和自动差异检测相关申请的交叉引用本申请根据35U.S.C.§119(e)要求于2017年5月25日提交的名称为“APPLIEDCOMPUTERTECHNOLOGYFORVISUALIZATION,COMPARATIVEANALYSIS,ANDAUTOMATEDDIFFERENCEDETECTIONFORLARGEMULTI-PARAMETERDATASETS[应用于大型多参数数据集的可视化、比较分析和自动差异检测的计算机技术]”的美国临时专利申请号62/511342的优先权权益,该专利申请的全部内容通过引用并入本文。在本申请资料表中标识的任何和所有优先权要求或其任何更正也根据37C.F.R.§1.57通过引用并入本文。专利技术背景
本披露内容总体上涉及自动粒子评估领域,并且更具体地涉及用于大型多参数数据集的计算机辅助样品分析和粒子表征特征。
技术介绍
诸如流式细胞仪和扫描细胞仪等粒子分析器是基于诸如光散射和荧光等电光测量结果来实现对粒子的表征的分析工具。例如,在流式细胞仪中,流体悬浮液中的粒子(诸如分子、分析物所结合的珠或独立细胞)经过检测区域,在该检测区域中,使这些粒子暴露于通常来自一个或多个激光器的激发光,并且测量这些粒子的光散射性质和荧光性质。通常用荧光染料来标记粒子或其组分以便于检测。通过使用不同光谱的荧光染料来标记多种不同的粒子或组分,可以同时检测这些不同的粒子或组分。在一些实施方式中,分析器中包括多个光电检测器(每个待测量的散射参数对应一个光电检测器、并且每个待检测的不同染料对应一个或多个光电检测器)。例如,一些实施例包括每种染料使用多于一个传感器或检测器的光谱配置。所获得的数据包括针对每个光散射检测器和荧光发射测得的信号。粒子分析器可以进一步包括用于记录测得的数据并分析该数据的装置。例如,可以使用连接到检测电子设备的计算机来执行数据存储和分析。例如,数据可以以表格形式存储,在表格中,每行对应于一种粒子的数据,并且列对应于所测得的特征中的每个特征。使用标准文件格式(诸如“FCS”文件格式)来存储来自粒子分析器的数据有助于使用不同的程序和/或机器来分析数据。使用目前的分析方法,通常以1维直方图或2维(2D)图来显示数据以便于可视化,但是也可以使用其他方法来可视化多维数据。使用例如流式细胞仪测得的参数通常包括:在主要沿前向方向的较窄角度中被粒子散射(称为前向散射(FSC))的处于激发波长的光、在与激发激光正交的方向上被粒子散射(称为侧向散射(SSC))的激发光、以及从测量一定光谱波长范围内的信号的一个或多个检测器中的荧光分子发射的或由主要在该特定检测器或检测器阵列中检测到的荧光染料发射的光。可以通过利用荧光染料标记的抗体或其他荧光探针标记各种细胞蛋白质或其他成分而得到的细胞光散射特性和荧光发射来标识不同的细胞类型。流式细胞仪和扫描细胞仪均可从例如BD生物科学事业部(BDBiosciences)(美国加州圣何塞)商购。流式细胞术在例如以下文献中进行了描述:Landy等(编者),ClinicalFlowCytometry[临床流式细胞术],AnnalsoftheNewYorkAcademyofSciences[纽约科学院年报]第677卷(1993);Bauer等(编者),ClinicalFlowCytometry:PrinciplesandApplications[临床流式细胞术:原理与应用],Williams和Wilkins(1993);Ormerod(编者),FlowCytometry:APracticalApproach[流式细胞术:实用方法],牛津大学出版(OxfordUniv.Press)(1994);Jaroszeski等(编者),FlowCytometryProtocols[流式细胞术规程],MethodsinMolecularBiology[分子生物学方法],第91期,胡马纳出版社(HumanaPress)(1997);以及PracticalShapiro,FlowCytometry[流式细胞术],第4版,Wiley-Liss(2003);这些文献全部通过引用并入本文。荧光成像显微术在例如以下文献中进行了描述:Pawley(编者),HandbookofBiologicalConfocalMicroscopy[生物共聚焦显微镜手册],第2版,PlenumPress(普莱纽姆出版社)(1989),该文献通过引用并入本文。通过某些粒子分析器(诸如多色流式细胞仪)对细胞(或其他粒子)的分析而获得的数据是多维的,其中,每个细胞对应于由所测得的参数定义的多维空间中的点。细胞或粒子的群体被标识为数据空间中的点集群。对集群以及由此对群体进行的标识可以通过在数据的一个或多个2维图(称为“散点图”或“点阵图”)中显示的群体周围绘制选通来手动执行。可替代地,可以标识集群,并且可以自动确定定义群体限制的选通。用于自动化选通的方法的示例已经在例如美国专利号4,845,653、5,627,040、5,739,000、5,795,727、5,962,238、6,014,904、和6,944,338以及美国专利公开号2012/0245889中进行了描述,这些专利各自都通过引用并入本文。
技术实现思路
本披露内容的系统、方法和设备各自具有若干创新方面,其中并非仅靠任何单一创新方面来负责本文所披露的期望属性。在一个创新方面,提供了一种对n维数据集之间的差异进行可视化的计算机实施的方法。可以在一个或多个处理设备的控制下执行该计算机实施的方法。该方法包括对n维数据的第一数据集和n维数据的第二数据集执行频率差选通。n维数据包括多个维度上的多个事件。该方法进一步包括从经频率差选通的数据生成可视化以经由显示设备进行显示,该可视化根据定义的阈值示出了多变量空间中来自该第一数据集的事件的频率不同于来自该第二数据集的事件的频率的区域。在该计算机实施的方法的一些实施方式中,第一数据集和第二数据集包括多参数细胞样品数据。在一些实施方式中,该计算机实施的方法还包括响应于用户输入来调整该定义的阈值、以及基于调整后的定义的阈值来调整该可视化。该定义的阈值可以包括或表示多个定义的阈值。该计算机实施的方法可以包括通过至少部分地基于该频率差选通对这些区域进行颜色编码来生成该可视化。该定义的阈值可以包括上限阈值,该上限阈值标识被分类为来自该第一数据集的事件的频率大于来自该第二数据集的事件的频率的一个或多个区域。另外地或可替代地,该定义的阈值可以包括下限阈值,该下限阈值标识来自该第二数据集的事件的频率大于来自该第一数据集的事件的频率的一个或多个区域。在一些实施方式中,如权利要求1所述的计算机实施的方法,其中,该定义的阈值包括中间范围边界,该中间范围边界标识在该第一数据集与该第二数据集之间具有相似的事件频率的一个或多个区域。该方法可以通过以下方式来执行频率差选通:根据该第一数据集和该第二数据集内的多个定义的分布中的每一个分布的二元频率估算量,生成每维度具有多本文档来自技高网
...

【技术保护点】
1.一种对n维数据集之间的差异进行可视化的计算机实施的方法,该计算机实施的方法包括:/n在一个或多个处理设备的控制下,/n对n维数据的第一数据集和n维数据的第二数据集执行频率差选通,其中,该n维数据包括多个维度上的多个事件;以及/n从经频率差选通的数据生成可视化以经由显示设备进行显示,该可视化根据定义的阈值示出了多变量空间中来自该第一数据集的事件的频率不同于来自该第二数据集的事件的频率的区域。/n

【技术特征摘要】
【国外来华专利技术】20170525 US 62/511,3421.一种对n维数据集之间的差异进行可视化的计算机实施的方法,该计算机实施的方法包括:
在一个或多个处理设备的控制下,
对n维数据的第一数据集和n维数据的第二数据集执行频率差选通,其中,该n维数据包括多个维度上的多个事件;以及
从经频率差选通的数据生成可视化以经由显示设备进行显示,该可视化根据定义的阈值示出了多变量空间中来自该第一数据集的事件的频率不同于来自该第二数据集的事件的频率的区域。


2.如权利要求1所述的计算机实施的方法,其中,该第一数据集和该第二数据集包括多参数细胞样品数据。


3.如权利要求1所述的计算机实施的方法,进一步包括:
响应于用户输入来调整该定义的阈值;以及
基于调整后的定义的阈值来调整该可视化。


4.如权利要求1所述的计算机实施的方法,其中,该定义的阈值包括多个定义的阈值。


5.如权利要求1所述的计算机实施的方法,其中,生成该可视化包括至少部分地基于该频率差选通来对这些区域进行颜色编码。


6.如权利要求1所述的计算机实施的方法,其中,该定义的阈值包括上限阈值,该上限阈值标识被分类为来自该第一数据集的事件的频率大于来自该第二数据集的事件的频率的一个或多个区域。


7.如权利要求1所述的计算机实施的方法,其中,该定义的阈值包括下限阈值,该下限阈值标识来自该第二数据集的事件的频率大于来自该第一数据集的事件的频率的一个或多个区域。


8.如权利要求1所述的计算机实施的方法,其中,该定义的阈值包括中间范围边界,该中间范围边界标识在该第一数据集与该第二数据集之间具有相似的事件频率的一个或多个区域。


9.如权利要求1所述的计算机实施的方法,其中,执行频率差选通包括:
根据该第一数据集和该第二数据集内的多个定义的分布中的每一个分布的二元频率估算量,生成每维度具有多个区间的多维直方图。


10.如权利要求9所述的计算机实施的方法,其中,执行频率差选通进一步包括:
通过事件计数对该直方图进行归一化。


11.如权利要求9所述的计算机实施的方法,其中,执行频率差选通进一步包括:
针对归一化直方图中的每个元素生成差异直方图。


12.如权利要求11所述的计算机实施的方法,其中,执行频率差选通进一步包...

【专利技术属性】
技术研发人员:马里奥·罗德尔迈克尔·D·斯塔德尼斯凯
申请(专利权)人:佛罗乔有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利