存储和检索数字病理学分析结果的方法技术

技术编号:25004944 阅读:38 留言:0更新日期:2020-07-24 18:04
本公开文本主要涉及用于分析、存储和/或检索与具有不规则形状的生物对象相关联的信息的自动化系统和方法。在一些实施方案中,所述系统和方法基于输入图像中的局部颜色、纹理和/或强度将输入图像划分成多个子区域,其中每个子区域代表有生物学意义的数据。

【技术实现步骤摘要】
【国外来华专利技术】存储和检索数字病理学分析结果的方法相关申请的交叉引用本申请要求2017年12月6日提交的美国临时专利申请No.62/595,143的申请日的权益,其披露内容通过引用整体并入本文中。
技术介绍
数字病理学涉及将整个组织病理学或细胞病理学玻片扫描成可在计算机屏幕上解释的数字图像。这些图像随后将由成像算法处理或由病理学家解释。为了检查组织切片(实际上是透明的),使用选择性结合细胞成分的有色组织化学染色剂制备组织切片。临床医生或计算机辅助诊断(CAD)算法使用颜色增强或染色的细胞结构来识别疾病的形态学标记,并相应地进行治疗。观察该测定可以实现多种过程,包括疾病诊断、对治疗反应的评估、以及研发抗击疾病的新药物。免疫组织化学(IHC)玻片染色可以用于识别组织切片的细胞中的蛋白质,并且因此广泛地用于对诸如生物组织中的癌性细胞和免疫细胞等不同类型的细胞的研究中。因此,可以在研究中使用IHC染色以理解癌组织中免疫细胞(诸如,T细胞或B细胞)的差异表达的生物标记的分布和位置以用于免疫应答研究。例如,肿瘤经常包含免疫细胞的浸润液,该浸润液可以防止肿瘤的发展或有利于肿瘤的向外生长。原位杂交(ISH)可用于寻找遗传异常或病状的存在,例如在显微镜下观察时在形态学上表现为恶性的细胞中特异性地致癌基因扩增。ISH使用与靶基因序列或转录物反义的标记的DNA或RNA探针分子来检测或定位细胞或组织样品中的靶核酸靶基因。通过将固定在玻片上的细胞或组织样品暴露于标记的核酸探针来进行ISH,所述核酸探针能够与细胞或组织样品中的给定靶基因特异性杂交。通过将细胞或组织样品暴露于已经用多个不同核酸标签标记的多个核酸探针,可以同时分析几个靶基因。通过利用具有不同发射波长的标记,可以在单个步骤中对单个靶细胞或组织样品进行同时多色分析。
技术实现思路
本公开文本主要涉及用于分析和存储与具有不规则形状的生物对象(例如成纤维细胞或巨噬细胞)相关联的数据的自动化系统和方法。本公开还涉及使用中分辨率分析(或中分辨率分析)法(即,将具有相似属性(例如,染色强度、染色存在、和/或纹理)的像素分组为“子区域”的方法)来分析和存储与生物对象相关联的数据的自动化系统和方法。在数字病理学中,图像是从安装在玻片上并被染色以识别生物标记的生物样本(例如,组织样本)获取的。可以在高倍显微镜下评估生物样品,或者用对感兴趣的生物对象进行检测和分类的数字病理学算法对其进行自动分析。例如,感兴趣的对象可以是细胞、血管、腺体、组织区域等。任何导出的信息都可以存储在数据库中以供以后检索,并且该数据库可以包括感兴趣的生物结构的存在、缺失、空间关系和/或染色属性的统计。本领域技术人员将会理解,清晰区分的细胞(例如,肿瘤细胞或免疫细胞)的分析结果的存储和检索相对简单,因为这样的细胞可以由每个细胞中心位置的点表示并存储在数据库中(例如,参见图4)。类似地,具有明确定义的尺寸和形状的生物对象(例如,血管)可以由简单的轮廓表示,其中轮廓的坐标可以存储在数据库中,用于以后的检索和/或进一步的分析(本文中也称为“多边形”或“多边形轮廓”)。另一方面,一些感兴趣的生物结构,例如成纤维细胞或巨噬细胞,具有不规则的形状。这些类型的细胞组可以围绕彼此或其他细胞延伸(见图5)。因此,通常很难通过观察者或自动算法来精确地单独识别这些不规则形状的细胞。相反,这些细胞通常仅通过其被染色的细胞质或膜的局部存在来识别,而不识别单个细胞。虽然使用高分辨率分析来分析和存储这种不规则形状的结构是可能的,但是这种方法通常需要大量的计算机资源(计算时间和/或存储资源)。事实上,存储感兴趣的生物结构的所有像素信息(例如,每个像素的分析结果)的高分辨率分析法被认为消耗了太多的软件和硬件资源(例如,用于处理或显示信息的存储器和处理器),并且最终可能不会为某些生物对象提供有意义的结果。还可以使用低分辨率分析来分析这种不规则结构,其中这种低分辨率数据表示可以将几个单独的细胞“聚团”成单个对象,以存储在数据库中。作为示例,图6A和图6B示出了对肿瘤(黄色,620)和成纤维细胞(紫色,610)染色的IHC图像的示例,其由围绕一组相关细胞的大的多边形轮廓(红色,630)表示,对于不期望的区域具有排除“孔”(青色,640)。在该示例中,分析结果在可能包含大量具有不同特征(例如,形状、大小、染色强度等)的单个细胞的大区域(红色轮廓,630)上进行平均。例如,关于图6B,画出轮廓的成纤维细胞活化蛋白(FAP)阳性面积为928.16um2,计算的FAP阳性平均强度为0.26。给定如此大的像素面积区域中的平均强度,0.26的平均强度是相当粗略的,以指示并代表该图像中的整个FAP阳性。不希望受任何特定理论的约束,认为当存储的结果随后被用于下游处理时,这种低分辨率分析法可能导致准确度的损失。因此,认为由于染色细胞的这种异质性,该方法不能局部呈现这种感兴趣的生物结构区域的实际细节。与上述高分辨率和低分辨率分析方法相比,本公开文本提供了通过将图像分割成多个子区域来使用中分辨率分析法导出对应于不规则形状细胞的数据的系统和方法,所述子区域具有相似的图像属性(例如,纹理、强度、或颜色中的至少一个)。鉴于前述内容,在当前公开文本的一个方面中,是一种存储从具有至少一种染色剂的生物样本的图像导出的图像分析数据的方法,包括:(a)从所述图像中导出一个或多个特征度量;(b)将所述图像分割成多个子区域,每个子区域包括在染色存在、染色强度、或局部纹理中的至少一个方面基本一致的像素;(c)基于所述多个分割子区域生成多个代表性对象;(d)将所述多个代表性对象中的每一个与所导出的特征度量相关联;以及(e)将每个代表性对象的坐标与所述相关联的导出特征度量一起存储在数据库中。本领域技术人员将理解,至少步骤(a)和(b)可以以任何顺序执行。在一些实施方案中,将所述图像分割成所述多个子区域包括导出超像素。在一些实施方案中,所述超像素是通过以下步骤来导出的:(i)用局部k均值聚类对像素进行分组;以及(ii)使用连通分量算法将小的孤立区域合并到最近的大的超像素中。不希望受任何特定理论的约束,认为超像素(作为子区域)具有感知意义,使得每个超像素是感知上一致的单元,即超像素中的所有像素在颜色和纹理上可能是一致的。在一些实施方案中,连通分量标记扫描图像,并基于像素连通性将其像素分组为分量,即,连通分量中的所有像素共享相似的像素强度值,并以某种方式彼此连通。在一些实施方案中,将所述图像分割成所述多个子区域包括将采样网格覆盖在所述图像上,所述采样网格定义具有预定大小和形状的非重叠区。在一些实施方案中,所述子区域具有MxN大小,其中M的范围在50像素到100像素,并且其中N的范围在50像素到大约100像素。在一些实施方案中,所述代表性对象包括满足预定染色强度阈值的子区域的轮廓。在一些实施方案中,代表性对象包括种子点。在一些实施方案中,通过计算所述多个子区域中每一个的形心来导出所述种子点。在一些实施方案中,所导出的特征度量是染色强度,并且其中计算每个生成的代表性对象轮廓内的所有像素的平本文档来自技高网
...

【技术保护点】
1.一种存储图像分析数据的方法,所述图像分析数据从具有至少一种染色剂的生物样本的图像中导出,所述方法包括:/n(a)从所述图像中导出一个或多个特征度量;/n(b)将所述图像分割成多个子区域,每个子区域包括在染色存在、染色强度、或局部纹理中的至少一个方面基本一致的像素;/n(c)基于所述多个分割子区域生成多个代表性对象;/n(d)将所述多个代表性对象中的每一个与所导出的特征度量相关联;以及/n(e)将每个代表性对象的坐标与所述相关联的导出特征度量一起存储在数据库中。/n

【技术特征摘要】
【国外来华专利技术】20171206 US 62/595,1431.一种存储图像分析数据的方法,所述图像分析数据从具有至少一种染色剂的生物样本的图像中导出,所述方法包括:
(a)从所述图像中导出一个或多个特征度量;
(b)将所述图像分割成多个子区域,每个子区域包括在染色存在、染色强度、或局部纹理中的至少一个方面基本一致的像素;
(c)基于所述多个分割子区域生成多个代表性对象;
(d)将所述多个代表性对象中的每一个与所导出的特征度量相关联;以及
(e)将每个代表性对象的坐标与所述相关联的导出特征度量一起存储在数据库中。


2.根据权利要求1所述的方法,其中将所述图像分割成所述多个子区域包括导出超像素。


3.根据权利要求2所述的方法,其中所述超像素是通过以下步骤来导出的:(i)用局部k均值聚类对像素进行分组;以及(ii)使用连通分量算法将小的孤立区域合并到最近的大的超像素中。


4.根据权利要求1至3中任一项所述的方法,其中将所述图像分割成所述多个子区域包括将采样网格覆盖在所述图像上,所述采样网格定义具有预定大小和形状的非重叠区。


5.根据权利要求1至4中任一项所述的方法,其中所述子区域具有MxN大小,其中M的范围在50像素到100像素,并且其中N的范围在50像素到大约100像素。


6.根据权利要求1至5中任一项所述的方法,其中所述代表性对象包括满足预定染色强度阈值的子区域的轮廓。


7.根据权利要求1至6中任一项所述的方法,其中所述代表性对象包括种子点。


8.根据权利要求7所述的方法,其中通过计算所述多个子区域中每一个的形心来导出所述种子点。


9.根据权利要求6所述的方法,其中所导出的特征度量包括染色强度,并且其中计算每个生成的代表性对象轮廓内的所有像素的平均染色强度。


10.根据权利要求1至7所述的方法,其中所导出的特征度量包括表达得分,并且其中对应于每个生成的子区域内的区域的平均表达得分与所生成的多个代表性对象相关联。


11.根据权利要求1至7中任一项所述的方法,其进一步包括从所述数据库中检索所存储的坐标和相关联的特征度量数据,并将所述检索到的数据投影到所述图像上。


12.一种用于从包含至少一种染色剂的生物样品的图像中导出对应于不规则形状细胞的数据的系统,所述系统包括:(i)一个或多个处理器、和(ii)联接到所述一个或多个处理器的存储器,所述存储器用于存储计算机可执行指令,当所述指令被所述一个或多个处理器执行时,使得所述系统执行操作,所述操作包括:
(a)从所述图像中导出一个或多个特征度量;
(b)在所述图像内生成多个子区域,每个子区域具有特性相似的像素,所述特性选自颜色、亮度和/或纹理;
(c)基于所生成的多个子区域计算一系列代表性对象;以及
(d)将从所述图像中导出的所述一个或多个特征度量与所述一系列计算出的代表性对象中的每一个的计算所得坐标相关联。


13.根据权利要求12所述的系统,其中将所述图像分割成所述多个子区域包括导出超像素。


14.根据权利要求12至13中任一项所述的系统,其中使用基于图形的方法或基于梯度上升的方法中的一种方法来导出所述超像素。


15.根据权利要求12至14中任一项所述的系统,其中所述超像素是通过以下步骤来导出的:(i)用局部k均值聚类对像素进行分组;以及(ii)使用连通分量算...

【专利技术属性】
技术研发人员:J·布雷德诺A·洛萨库勒
申请(专利权)人:文塔纳医疗系统公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1