当前位置: 首页 > 专利查询>贝克顿专利>正文

用于机器学习分析的细胞术数据的最佳缩放方法及其系统技术方案

技术编号:38768180 阅读:25 留言:0更新日期:2023-09-10 10:41
本公开的各个方面包括用于处理和缩放细胞术数据的方法。根据某些实施方案的方法包括:获取样本的细胞术数据,其中该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。还提供了用于实践本主题方法的系统。还描述了非暂时性计算机可读存储介质。读存储介质。读存储介质。

【技术实现步骤摘要】
【国外来华专利技术】用于机器学习分析的细胞术数据的最佳缩放方法及其系统
[0001]交叉引用
[0002]根据35U.S.C.
§
119(e),本申请要求于2020年11月19日提交的美国临时专利申请序列号63/115,994的优先权,该申请的全部内容通过引用并入本文。

技术介绍

[0003]流式颗粒检测和分析系统例如流式细胞仪用于基于颗粒的至少一个测量特征对流体样本中的颗粒进行检测、分析,并在部分情况下进行分选。对从流式颗粒检测和分析系统获得的数据进行可视化是分析和表征所收集数据的重要部分,并可用于例如生物和医学研究。
[0004]对从流式颗粒检测系统获得的数据进行分析可能需要对从颗粒检测系统的几个不同检测器通道所获得的数据进行可视化,例如显示从颗粒检测系统的几个不同检测器通道所获得的数据的绘图,其中绘图中显示的一个或更多个参数已被缩放。使用一个或更多个缩放参数来分析数据,例如分析数据的可视化表示,会有助于了解和表征暴露于颗粒检测系统的颗粒,以及重要的是,有助于了解和表征颗粒的群体或聚簇。
[0005]使用一个或更多个缩放参数来分析细胞术数据能够通过帮助区分指示颗粒例如细胞类型之间的相似性或差异的信号与由例如测量或仪器误差引起的噪声而在了解数据群体方面发挥重要作用。当细胞术数据是高维数据时,缩放参数在区分信号和噪声方面的作用更加明显,因为高维数据为噪声提供了额外的机会来影响颗粒聚集在一起的方式。细胞术数据、尤其是高维数据、的适当缩放能够通过减轻或压缩细胞术数据中的噪声来改善分析中的信噪比特征。
专利技术内容
[0006]本专利技术的实施例介绍了更有效地缩放细胞术数据的新技术,该技术提高细胞术数据的信噪比(特别是对于高维细胞术数据而言),从而提高了流式颗粒检测和分析系统的可用性。
[0007]本公开的各个方面包括用于缩放细胞术数据的方法。根据某些实施例的方法包括:获取样本的细胞术数据,其中该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。
[0008]在部分实施例中,转换感兴趣参数包括重新缩放感兴趣参数的指定负测量区间。在此类实施例中,重新缩放感兴趣参数的指定负测量区间包括减少感兴趣参数的指定负测量区间的标准偏差。在其它实施例中,转换感兴趣参数还包括重新缩放感兴趣参数的指定正测量区间。在此类实施例中,重新缩放指定的正测量区间可以包括将正测量区间重新缩放到预定大小。在部分例子中,该预定大小是与多个参数中的第二参数对应的经缩放的正测量区间的大小。
[0009]在本主题方法的实施例中,转换感兴趣参数包括根据
来自适应地缩放感兴趣参数,其中s(x)表示感兴趣参数的自适应缩放测量值;x表示感兴趣参数的未缩放测量值;(n

,n
+
)是感兴趣参数的指定负测量区间;(n
+
,p)是感兴趣参数的指定正测量区间;c是压缩系数;是负测量区间的中位数;SD是负测量区间的标准偏差,并且根据来计算,其中IQR是负测量区间的四分位间距;z(x)是根据的z转换;g(z)是根据的反向双曲正弦函数;并且是μ=z(n
+
)且σ=1的标准正态分布的累积分布函数。在此类实施例中,默认的压缩系数c的默认值可以为70。
[0010]在实施例中,本主题方法还包括显示经缩放的细胞术数据。在部分例子中,显示经缩放的细胞术数据包括显示包含转换后的感兴趣参数的细胞术数据的绘图。
[0011]在部分实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括执行一维门控以指定区间。在其它实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括应用荧光减一控制来指定区间。在其它实施例中,指定感兴趣参数的正测量区间和负测量区间中的至少一个包括应用数学模型来指定区间。在实例中,指定感兴趣参数的正测量区间和负测量区间中的一者或两者包括应用机器学习算法来指定区间。
[0012]本主题方法的实施例还可以包括:识别一个或更多个附加的感兴趣参数;指定附加的感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放细胞术数据。在此类实施例中,可以将每个感兴趣参数的指定正测量区间重新缩放到相同的预定大小。
[0013]本主题方法的其它实施例还可以包括通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类。在此类实施例中,显示经缩放的细胞术数据可以包括显示经缩放的细胞术数据的聚簇。
[0014]在部分实施例中,经缩放的细胞术数据被用于改进应用于细胞术数据的聚类算法的性能。在其他实施例中,经缩放的细胞术数据被用于降低测量噪声的影响。
[0015]在部分例子中,颗粒是细胞。在这种情况下,经缩放的细胞术数据可用于区分两个相似的细胞群体。
[0016]在本主题方法的实施例中,细胞术数据为高维数据。在此类实施例中,多个测量参数为两个到大约300,000个测量参数。
[0017]还提供了用来实践本主题方法的系统。根据某些实施例的系统包括装置和处理器,该装置被配置为获取细胞术数据,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值,该处理器包括可操作地耦合到处理器的存储器,其中该存储器包括存储在其上的指令,这些指令在被处理器执行时,使处理器:识别感兴趣参数;指定感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据。
[0018]在本主题系统的实施例中,该系统被配置为使经缩放的细胞术数据显示在显示设备上。在此类实施例中,该系统被配置为通过使包含转换后的感兴趣参数的细胞术数据图
进行显示来使经缩放的细胞术数据显示在显示设备上。在部分实施例中,系统被配置成:识别一个或更多个附加的感兴趣参数;指定每个附加的感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换每个附加的感兴趣参数来缩放细胞术数据。在部分实施例中,该系统被配置为通过将聚类算法应用于经缩放的细胞术数据来对细胞术数据进行聚类。在其它实施例中,该系统被配置成使经缩放的细胞术数据的聚簇进行显示。在其它实施例中,样本的细胞术数据包括从被配置为分析样本的流式细胞仪获得的测量值。
[0019]还描述了非暂时性计算机可读存储介质。根据某些实施例的非暂时性计算机可读存储介质包括存储在其上的指令,这些指令具有以下算法:用于获取细胞术数据的算法,该细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;用于识别感兴趣参数的算法;用于指定感兴趣参数的正测量区间和负测量区间的算法;以及用于通过至少部分地基于对应的指定正区间和负区间转换感兴趣参数来缩放细胞术数据的算法。
附图说明
[0020]结合附图阅读时,可以从以下详细描述中获得对本专利技术的最佳理解。附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种缩放细胞术数据的方法,所述方法包括:获取样本的细胞术数据,其中所述细胞术数据包括在流动流中流动的样本中被照射颗粒的多个参数的测量值;识别感兴趣参数;指定所述感兴趣参数的正测量区间和负测量区间;以及通过至少部分地基于对应的指定正区间和负区间转换所述感兴趣参数来缩放所述细胞术数据。2.根据权利要求1所述的方法,其中,转换所述感兴趣参数包括重新缩放所述感兴趣参数的指定负测量区间。3.根据权利要求2所述的方法,其中,重新缩放所述感兴趣参数的指定负测量区间包括减少所述感兴趣参数的指定负测量区间的标准偏差。4.根据权利要求2

3中任一项所述的方法,其中,转换所述感兴趣参数还包括重新缩放所述感兴趣参数的指定正测量区间。5.根据权利要求4所述的方法,其中,重新缩放所述指定正测量区间包括将所述正测量区间重新缩放到预定大小。6.根据权利要求5所述的方法,其中,所述预定大小为所述负测量区间的大小。7.根据权利要求5所述的方法,其中,所述预定大小是与所述多个参数中的第二参数对应的经缩放的正测量区间的大小。8.根据权利要求1

7中任一项所述的方法,其中,转换所述感兴趣参数包括根据以下公式自适应地缩放所述感兴趣参数:其中:s(x)表示所述感兴趣参数的自适应缩放测量值;x表示所述感兴趣参数的未缩放测量值;(n

,n
+
)是所述感兴趣参数的指定负测量区间;(n
+
,p)是所述感兴趣参数的指定正测量区间;C是压缩系数;是所述负测量区间的中位数;SD是所述负测量区间的标准偏差,并且根据来计算,其中IQR是所述负测量区间的四分位间距;...

【专利技术属性】
技术研发人员:尼古拉
申请(专利权)人:贝克顿
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1