使用基准对齐对分析物进行空间分析的系统和方法技术方案

技术编号:34829886 阅读:27 留言:0更新日期:2022-09-08 07:22
提供了用于分析物的空间分析的系统和方法。获得一种数据结构,其包含具有标识符、基准标记和一组捕获点的基底上的样品的图像,作为像素值阵列。所述像素值用于标识导出基准点。基底标识符标识具有参考基准点的参考位置和对应的坐标系的模板。使用对齐算法将所述导出基准点与所述参考基准点对齐,以获得所述导出基准点与所述参考基准点之间的变换。所述变换和所述模板对应的坐标系用于将所述图像配准到所述一组捕获点。然后结合与每个捕获点相关联的空间分析物数据来分析所配准的图像,从而执行分析物的空间分析。执行分析物的空间分析。执行分析物的空间分析。

【技术实现步骤摘要】
【国外来华专利技术】使用基准对齐对分析物进行空间分析的系统和方法
[0001]相关申请的交叉引用
[0002]本申请要求于2019年11月22日提交的题为《使用基准对齐进行空间分析的系统和方法(Systems and Methods for Spatial Analysis Using Fiducial Alignment)》的美国临时专利申请第62/938,967号的优先权,其通过引用整体并入本文。


[0003]本说明书描述了涉及处理大型复杂的数据集中的观察到的分析物数据(如空间排列的下一代测序数据)的技术。

技术介绍

[0004]复杂组织中分析物的空间分辨率提供了对生物功能和形态学的基础过程的新见解,如细胞命运和发育、疾病进展和检测,以及细胞和组织水平的调节网络。参见,Satija等人,2015,《单细胞基因表达数据的空间重建(Spatial reconstruction of single

cell gene expression data)》,《自然生物技术(Nature Biotechnology.)》33,495

502,doi:10.1038.nbt.3192和Achim等人,2015,《单细胞RNA序列数据到起源组织的高通量空间映射(High

throughput spatial mapping of single

cell RNA

seq data to tissue of origin)》,《自然生物技术》33:503

509,doi:10.1038/nbt.3209,其各自通过引用整体并入本文。
[0005]对分析物之间的空间模式或其它形式的关系的理解可以提供关于差异细胞行为的信息。这反过来有助于阐明复杂的病症,如复杂的疾病。例如,分析物(例如,基因)的丰度与特定组织类(例如,疾病组织、健康组织、疾病组织和健康组织的边界等)的组织亚群相关联的确定提供了分析物与如复杂疾病等病症相关联的推理证据。同样,分析物的丰度与复杂2维或3维组织(例如,哺乳动物脑、肝、肾、心脏、肿瘤或模型生物体的发育胚胎)中的异质细胞群体的特定亚群相关联的确定提供了分析物在特定亚群中的关联的推理证据。
[0006]因此,分析物的空间分析可以通过标识复杂组织中的风险区域并通过(例如,基因表达、蛋白质表达、DNA甲基化和/或单核苷酸多态性等的)空间重建表征这些区域中存在的分析物图谱来为疾病的早期检测提供信息。分析物到其在区域或子区域内的特定位置的高分辨率空间映射揭示了分析物的空间表达模式,提供了相关数据,并进一步暗示了与疾病或其它感兴趣的形态或表型有关的分析物网络相互作用,从而导致对细胞在其形态背景下的整体理解。参见,10X,2019,《空间解析的转录组学(Spatially

Resolved Transcriptomics)》,10X,2019,《内部Visium空间技术(Inside Visium Spatial Technology)》和10X,2019,《Visium空间基因表达解决方案(Visium Spatial Gene Expression Solution)》,其各自通过引用整体并入本文。
[0007]分析物的空间分析可以通过捕获分析物和/或分析物捕获剂或分析物结合域并使用指示对应于已知位置的感兴趣的组织或区域的参考图像将其映射到已知位置(例如,使用附着于基底的条形码捕获探针)来进行。例如,在空间分析的一些实施方式中,制备样品
(例如,将新鲜冷冻的组织切片、置于载片上、固定和/或染色以进行成像)。样品的成像提供了用于空间分析的参考图像。然后使用例如经由条形码捕获探针的分析物或分析物配体捕获、文库构建和/或测序进行分析物检测。所得条形码分析物数据和参考图像可以在数据可视化期间组合以进行空间分析。参见,10X,2019,《内部Visium空间技术》,其通过引用并入本文。
[0008]这种分析的一个困难是确保样品或样品的图像(例如,组织切片或组织切片的图像)与条形码捕获探针正确对齐(例如,使用基准对齐)。在用于组织样品制备和切片的传统湿实验室方法中,频繁出现样品质量的缺陷进一步复杂化了本领域的技术限制。这些问题是由于组织样品本身的性质(尤其包括间隙区域、液泡和/或在成像后通常难以解释的一般粒度)或由于不适当的处理或样品降解而引起的,不适当的处理或样品降解导致样品中的间隙或孔(例如,撕裂样品或仅获得部分样品,如从活组织检查中获得)。另外,用于成像的湿实验室方法会导致其它缺陷,包括但不限于气泡、碎片、沉积在基底或组织上的结晶染色颗粒、不一致或较差的对比度染色,和/或产生图像模糊、曝光过度或曝光不足,和/或分辨率差的显微镜限制。参见,Uchida,2013,《生物图像的图像处理和识别(Image processing and recognition for biological images)》,《发展、生长和分化(Develop.Growth Differ.)》55,523

549,doi:10.1111/dgd.12054,其通过引用整体并入本文。这种缺陷使得对齐更加困难。
[0009]因此,在本领域中需要提供改进的对齐的系统和方法。此类系统和方法将允许图像中组织样品的可再现的标识和对齐,而不需要大量的培训和劳动力成本,并且将通过消除由于主观对齐引起的人为误差来进一步提高标识的准确性。此类系统和方法将进一步为从业者提供成本有效的、用户友好的工具,以可靠地执行组织切片中的分析物的空间重建,而不需要在提供图像之外的空间映射步骤期间的附加用户输入。

技术实现思路

[0010]在本公开中提供了用于解决上述空间对齐问题的技术方案(例如,计算系统、方法和非暂时性计算机可读存储介质)。
[0011]以下呈现本公开的概述以便提供对本公开的一些方面的基本理解。该
技术实现思路
不是本公开的广泛综述。其不旨在标识本公开的关键/重要元素或描绘本公开的范围。其唯一目的是以简化形式呈现本专利技术的一些概念,作为稍后呈现的更详细描述的序言。
[0012]公开了用于分析物的空间分析的系统和方法,其中以电子形式获得数据结构,其包含(i)基底上的样品(例如,切片的组织样品)的图像和(ii)对于基底(例如,芯片)唯一的基底标识符。基底包括多个基准标记和一组捕获点。在一些实施例中,该组捕获点包含至少1000、2000、5000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95,000或100,000个捕获点。图像包含像素值阵列。在一些实施例中,像素值阵列包含至少100、10,000、100,000、1x106、2x106、3x106、5x106、8x106、10x106或15x1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种分析物的空间分析方法,其包含:A)获得电子形式的数据结构,其包含(i)基底上的样品的图像和(ii)对所述基底唯一的基底标识符,其中:所述基底包括多个基准标记,所述基底包括一组捕获点,其中所述一组捕获点包含至少1000个捕获点;并且所述图像包含像素值阵列,其中所述像素值阵列包含至少100,000个像素值;B)分析所述像素值阵列以标识所述图像的多个导出基准点;C)使用所述数据结构的所述基底标识符来选择多个模板中的第一模板,其中所述多个模板中的每个模板包含对应的多个参考基准点的参考位置和对应的坐标系;D)使用对齐算法将所述图像的所述多个导出基准点与所述第一模板的所述对应的多个参考基准点进行对齐,以获得所述图像的所述多个导出基准点与所述第一模板的所述对应的多个参考基准点之间的变换;E)使用所述变换和所述第一模板的所述坐标系将所述图像配准到所述一组捕获点;以及F)在所述使用E)之后结合与每个捕获点相关联的空间分析物数据来分析所述图像,从而执行分析物的空间分析。2.根据权利要求1所述的方法,其中所述B)分析包含:通过将所述像素值阵列阈值化为多个阈值图像并在所述多个阈值图像内标识具有白色值的像素组来标识多个候选导出基准点,基于点大小对所述多个候选导出基准点进行聚类,从而将所述多个候选导出基准点分配到多个候选导出基准点子集中,其中所述多个候选导出基准点子集中的每个相应候选导出基准点子集具有特征大小,以及选择所述多个候选导出基准点子集中具有最大特征大小的所述候选导出基准点子集作为所述图像的所述多个导出基准点。3.根据权利要求2所述的方法,其中所述标识进一步包含合并在彼此的阈值距离内的各个候选导出基准点对。4.根据权利要求2所述的方法,其中所述标识进一步包含过滤掉不能满足最大或最小大小标准的相应候选导出基准点。5.根据权利要求2所述的方法,其中所述标识进一步包含过滤掉不能满足圆度标准的相应候选导出基准点,其中各个导出基准点的圆度由下式定义:其中,“面积”是所述各个导出基准点的所述面积,并且“周长”是所述各个导出基准点的所述周长。6.根据权利要求2所述的方法,其中所述标识进一步包含过滤掉不能满足凸度标准的相应候选导出基准点。7.根据权利要求2所述的方法,其中所述标识进一步包含过滤掉不能满足惯性比标准
的相应候选导出基准点。8.根据权利要求1所述的方法,其中所述变换是相似性变换,其包含图像的多个导出基准点的旋转、平移和各向同性缩放,以最小化多个导出基准点和对应的多个参考基准点之间的残差。9.根据权利要求1所述的方法,其中所述变换是非刚性变换,其包含所述图像的所述多个导出基准点的各向异性缩放和偏斜,以最小化所述多个导出基准点和所述对应的多个参考基准点之间的残差。10.根据权利要求9所述的方法,其中所述非刚性变换是仿射变换。11.根据权利要求1所述的方法,其中所述对齐算法是相干点漂移算法。12.根据权利要求1所述的方法,其中所述对齐算法是迭代最近点算法。13.根据权利要求1所述的方法,其中所述对齐算法是鲁棒点匹配算法或薄板样条鲁棒点匹配算法。14.根据权利要求1至13中任一项所述的方法,其中所述第一模板的所述对应的多个参考基准点由100个至1000个之间的点组成。15.根据权利要求1至14中任一项所述的方法,其中:所述样品是切片组织样品,所述一组捕获点中的每个相应捕获点(i)位于二维阵列中的不同位置处,并且(ii)与来自所述切片组织样品的一种或多种分析物缔合,并且所述一组捕获点中的每个相应捕获点由多个空间条形码中的至少一个唯一空间条形码来表征。16.根据权利要求1至15中任一项所述的方法,其中所述一组捕获点中的捕获点包含捕获域。17.根据权利要求1至15中任一项所述的方法,其中所述一组捕获点中的捕获点包含切割域。18.根据权利要求1至15中任一项所述的方法,其中所述一组捕获点中的每个捕获点直接附着或间接附着于所述基底。19.根据权利要求15所述的方法,其中一种或多种分析物包含五种或更多种分析物、十种或更多种分析物、五十种或更多种分析物、一百种或更多种分析物、五百种或更多种分析物、1000种或更多种分析物、2000种或更多种分析物,或2000种至10,000种分析物。20.根据权利要求15所述的方法,其中唯一空间条形码对从集合{1,

,1024}、{1,

,4096}、{1,

,16384}、{1,

,65536}、{1,

,262144}、{1,

,1048576}、{1,

,4194304}、{1,

,16777216}、{1,

,67108864}或{1,

,1x 10
12
}中选择的唯一预定值进行编码。21.根据权利要求1至20中任一项所述的方法,其中所述一组捕获点中的每个相应捕获点包括1000个或更多个捕获探针、2000个或更多个捕获探针、10,000个或更多个捕获探针、100,000个或更多个捕获探针、1x 106个或更多个捕获探针、2x 106个或更多个捕获探针,或5x 106个或更多...

【专利技术属性】
技术研发人员:N
申请(专利权)人:一零X基因组学有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1