用于根据多参数细胞和亚细胞成像数据表征细胞表型多样性的系统和方法技术方案

技术编号:31502762 阅读:21 留言:0更新日期:2021-12-22 23:24
一种表征细胞表型的方法,包括接收来自多个患者或多个多细胞体外模型的多个组织样品的多参数细胞和亚细胞成像数据,对所述多参数细胞和亚细胞成像数据进行细胞分割以产生经分割的多参数细胞和亚细胞成像数据,以及对经分割的多参数细胞和亚细胞成像数据进行递归分解以识别多个计算表型。递归分解包括多个分解水平,每个分解水平包括软/概率聚类和空间正则化,并且经分割的多参数细胞和亚细胞成像数据中的每个细胞被概率地分配给多个计算表型中的一个或多个。型中的一个或多个。型中的一个或多个。

【技术实现步骤摘要】
【国外来华专利技术】用于根据多参数细胞和亚细胞成像数据表征细胞表型多样性的系统和方法
[0001]政府合同
[0002]本专利技术是在由国家卫生研究院(National Institutes of Health,NIH)给予的补助金#CA204826下,在政府支持下完成的。政府对本专利技术享有一定权利。

技术介绍


[0003]本专利技术涉及数字病理学,并且具体地涉及用于根据从各种成像模态获得的多参数细胞和亚细胞成像数据(例如,多重复合到超复合成像数据)来表征和分类各种细胞类型及其活化(细胞表型)的无监督分级学习系统和方法。
[0004]现有技术的描述
[0005]数字病理学是指组织学染色的组织样品的获取、存储和显示,并且最初在诸如第二意见远程病理学、免疫染色解释学和术中远程病理学的生态位(niche)应用中具有吸引力。通常,在数字病理学中,由多个载玻片组成的大量患者数据从活检样品生成,并且由病理学家通过在高清晰度监视器上查看载玻片来评估。由于涉及人工劳动,当前的工作流做法是耗时的、容易出错的和主观的。
[0006]组织是具有在空间上彼此连通的多种不同细胞类型的异型细胞系统。数字病理学的一个挑战是如何准确且有效地根据多参数细胞和亚细胞成像数据表征各种细胞类型以及它们的活化,所述多参数细胞和亚细胞成像数据是从各种多重复合到超复合成像模态获得的。

技术实现思路

[0007]在一个实施例中,提供了一种根据多参数细胞和亚细胞成像数据表征来自多个患者或多个多细胞体外模型的多个组织样品的细胞表型的方法。所述方法包括接收经分割的多参数细胞和亚细胞成像数据,其中所述经分割的多参数细胞和亚细胞成像数据是通过对所述多参数细胞和亚细胞成像数据执行细胞分割,以及对所述经分割的多参数细胞和亚细胞成像数据执行递归分解以识别多个计算表型而生成的。递归分解包括多个分解水平,每个分解水平包括软/概率聚类和空间正则化,并且经分割的多参数细胞和亚细胞成像数据中的每个细胞被概率地分配给多个计算表型中的一个或多个计算表型/由多个计算表型中的一个或多个计算表型拥有。更具体地,例如,这种概率分配/所有权意味着细胞可具有X%的属于表型A的概率和Y%的属于表型B的概率等等。在一个特定实施例中,可将细胞确定性地分配给多个计算表型中的仅一者以易于可视化和解释。
[0008]在另一个实施例中,提供了一种计算机化系统,用于根据来自多个患者的多个组织样品或多个多细胞体外模型的多参数细胞和亚细胞成像数据来表征细胞表型。该系统包括处理装置,该处理装置包括细胞表型表征组件,该细胞表型表征组件被配置用于接收经
分割的多参数细胞和亚细胞成像数据,其中所述经分割的多参数细胞和亚细胞成像数据是通过对所述多参数细胞和亚细胞成像数据执行细胞分割,以及对所述经分割的多参数细胞和亚细胞成像数据执行递归分解以识别多个计算表型而生成的。递归分解包括多个分解水平,每个分解水平包括软/概率聚类和空间正则化。经分割的多参数细胞和亚细胞成像数据中的每个细胞被概率地分配给多个计算表型中的一个或多个计算表型/由多个计算表型中的一个或多个计算表型拥有。
附图说明
[0009]图1是根据本公开的概念的示例性实施例的表征多重复合到超复合成像数据中的细胞表型多样性的方法的流程图;
[0010]图2是根据图1的方法生成的两个示例性子群组的示例性细胞表型树的示意性表示;
[0011]图3是可以根据本公开的概念的方面生成的示例性热图的示意性表示;
[0012]图4是可以根据本公开的概念的方面生成的示例性图像,其中基于本公开的概念的子群组结果对细胞边界进行颜色编码;以及
[0013]图5是根据本公开的概念的示例性实施例的用于根据多参数细胞和亚细胞成像数据来表征和分类细胞类型及其活化(细胞表型)的示例性数字病理学系统的示意图。
具体实施方式
[0014]如本文所用,单数形式的“一”、“一个”和“该”包括复数指代,除非上下文另外清楚地指明。
[0015]如这里所使用的,两个或多个部件或组件“耦合”的陈述应当意味着,只要发生连接,这些部件就直接或间接地(即,通过一个或多个中间部件或组件)接合或一起操作。
[0016]如本文所用,术语“若干”应指一个或大于一的整数(即,多个)。
[0017]如在此所使用的,术语“组件”和“系统”旨在表示计算机相关的实体,或者是硬件、硬件和软件的组合、软件、或者是执行中的软件。例如,组件可以是(但不限于)在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。作为说明,在服务器上运行的应用程序和服务器都可以是组件。一个或多个组件可以驻留在进程和/或执行线程内,并且组件可以位于一个计算机上和/或分布在两个或更多计算机之间。尽管关于某些附图或作为屏幕截图的图形示出并描述了向用户显示信息的某些方式,但是相关领域的技术人员将认识到,可以采用各种其它替换方式。
[0018]如本文所用,术语“多重复合成像”应指采用多达7种生物标志物的成像技术,并且“多重复合图像”应指使用多重复合成像产生的图像。
[0019]如本文所使用的,术语“超复合成像”应当指采用多于7种生物标志物的成像技术,并且“超复合图像”应当指使用超复合成像创建的图像。
[0020]如在此所使用的,术语“多重复合到超复合成像”应当包括多重复合成像和/或超复合成像,并且“多重复合到超复合图像”应当包括多重复合图像和/或超复合图像。
[0021]本文所使用的方向短语,例如但不限于顶部、底部、左、右、上、下、前、后及其派生词,涉及附图中所示的元件的曲线,并且不限制权利要求,除非其中明确指出。
[0022]为了解释的目的,现在将结合许多具体细节来描述本公开的概念,以便提供对本专利技术的透彻理解。然而,将显而易见的是,在不背离本专利技术创造的精神和范围的情况下,可以在没有这些具体细节的情况下实践本公开的概念。
[0023]本公开的概念提供了一种新颖的无监督分级学习技术,以表征根据各种成像模态获得的多重复合到超复合成像数据中的细胞表型多样性。在示例性实施例中,本文结合根据具有超复合免疫荧光生物标志物数据形式的多参数细胞和亚细胞成像数据表征和分类各种细胞类型及其活化(细胞表型)描述了本公开的概念。然而,应当理解,这仅是示例性的,并且本公开的概念可以结合任何空间多参数细胞和亚细胞成像数据来使用,包括但不限于使用以下成像模态中的任何一种获得的成像数据:透射光、H&E和IHC的组合(1种至多种生物标志物);荧光;免疫荧光(包括但不限于抗体、纳米抗体);活细胞生物标志物多重复合、超复合;质谱(包括但不限于CyTOF);空间转录组学(包括但不限于FISH);以及电子显微镜。靶包括但不限于组织样品(人和动物)以及组织和器官(人和动物)的体外模型。
[0024]如本文更详细地描述的,本公开的概念的主要思想之一是它采用数据驱动的表型而不是用户定义的表型。更具体地,在疾病生物学文献中,用户非常普遍的是沿着以下路线定义表型(用户定义本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种根据多参数细胞和亚细胞成像数据表征来自多个患者或多个多细胞体外模型的多个组织样品的细胞表型的方法,包括:接收经分割的多参数细胞和亚细胞成像数据,其中,所述经分割的多参数细胞和亚细胞成像数据是通过对所述多参数细胞和亚细胞成像数据执行细胞分割而生成的;以及对所述经分割的多参数细胞和亚细胞成像数据执行递归分解以识别多个计算表型,其中所述递归分解包括多个分解水平,其中每个分解水平包括软/概率聚类和空间正则化,并且其中所述经分割的多参数细胞和亚细胞成像数据中的每个细胞被概率地分配至所述多个计算表型中的一个或多个。2.根据权利要求1所述的方法,还包括生成视觉表示,在所述视觉表示中,所述经分割的多参数细胞和亚细胞成像数据中的每个细胞基于每个细胞的相应最高所有权概率与所述多个计算表型中的仅一个计算表型概率地相关联。3.根据权利要求1所述的方法,还包括生成细胞表型树,在所述细胞表型树中,所述经分割的多参数细胞和亚细胞成像数据中的每个细胞被概率地分配到所述多个计算表型中的一个或多个,其中,所述细胞表型树包括多个终端节点,其中,所述终端节点中的每个终端节点表示所述多个计算表型中的相应的一个计算表型。4.根据权利要求3所述的方法,其中,每个终端节点的大小对应于被分配给所述终端节点的计算表型的所述细胞的一部分。5.根据权利要求1所述的方法,其中,所述多参数细胞和亚细胞成像数据包括多重复合到超复合的免疫荧光生物标记数据或多重复合至超复合的基于质谱的生物标记数据。6.根据权利要求1所述的方法,还包括使用所述多个计算表型来形成多因素分析MFA模型的参数。7.根据权利要求6所述的方法,还包括使用所述MFA模型的参数应用Kullback

Leiber KL散度度量来定量所述计算表型中的任何两者之间的差异。8.根据权利要求7所述的方法,还包括基于应用KL散度度量的结果生成热图。9.根据权利要求1所述的方法,其中,所述软/概率聚类包括多个簇,其中,每个簇对应于所述多个计算表型中的相应一个计算表型,其中,每个簇被定义为参数低维子空间的分层混合,并且其中,所述经分割的多参数细胞和亚细胞成像数据中的每个细胞被每个簇概率地拥有。10.根据权利要求1所述的方法,其中,所述递归分解采用递归的停止标准,所述递归的停止标准包括应用于所述分层混合的子空间之间的角度的阈值,以确保所述计算表型是不同的。11.根据权利要求9所述的方法,其中,所述空间正则化采用包括第一项和第二项的函数,第一项促进簇分配中的稀疏性并且意味着每个细胞试图完全属于簇中的一个,第二项促进空间一致性。12.根据权利要求11所述的方法,其中,使用交替方向乘子方法ADMM来优化所述函数。13.根据权利要求3所述的方法,其中,所述递归分解采用停止标准,所述停止标准在以下情况下停止递归:(i)所得到的簇取得<1%的细胞的所有权,(ii)确定细胞表型树已经超过给定的深度阈值,或(iii)平均向量和因素负荷空间之间的角度都低于给定的阈值。14.一种存储包括指令的一个或多个程序的非暂态计算机可读介质,所述指令在由计
算机执行时使得所述计算机执行根据权利要求1所述的方法。15.一种用于表征细胞表型的计算机化系...

【专利技术属性】
技术研发人员:S
申请(专利权)人:匹兹堡大学高等教育联邦体系
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1