System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 组织基因表达数据三维重建的方法和系统技术方案_技高网

组织基因表达数据三维重建的方法和系统技术方案

技术编号:40559083 阅读:9 留言:0更新日期:2024-03-05 19:21
本发明专利技术涉及一种计算机实现的组织样品中含poly‑A的RNA空间丰度分析,包括以下步骤:(i)获得成像数据和测序数据,(ii)配准成像数据并检测珠粒,并采用第一种机器学习方法从成像数据中获得第一条形码集,(iii)处理测序数据以从测序数据中获得第二条形码集,(iv)通过最优传输框架和/或监督机器学习处理第一和第二条形码集,以使数据集彼此匹配并获得匹配的条形码,(v)基于匹配的条形码输出一个矩阵,所述矩阵包含在所述数据中发现的每个珠粒中鉴别的每个基因的表达值。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及一种用于组织基因表达数据的三维(3d)重建的方法和系统。具体地,本专利技术涉及用于组织基因表达或转录组数据的三维(3d)重建、它们各自的可视化和分析的系统和方法。


技术介绍

1、组织样品的全基因组基因表达模式的3d可视化和分析可以用于若干生物医学应用中,例如在肿瘤组织中的转移过程的研究中。在过去已经广泛地进行了患病组织的基因表达谱的研究,其对于疾病机制的基本理解是重要的。

2、对于鉴别新的药物靶点和生物标志物以改善患者的预后尤其重要。对所有基因进行平行无偏见研究对于发现新的治疗实体至关重要,并且这只能通过下一代测序(ngs)技术实现。由于肿瘤和其他患病组织由各种细胞组成,每个细胞对疾病有不同的贡献,因此以单细胞分辨率分析基因表达的方法是辨别分子机制的关键。

3、在另一个方面,细胞排列在空间中,这对于理解例如免疫细胞和癌细胞的相互作用是重要的,这是免疫肿瘤学的中心话题。已经开发了多种方法以单细胞分辨率和在2d组织切片中研究所有基因的表达,参见rodriquez等人,science(2019)363,1463-1467;vickovic等人。nat methods(2019)16,987-990。

4、由于肿瘤组织是三维的,二维(2d)测量不足以捕捉其异质性。因此,本专利技术通过a)用于生成2d基因表达“图像”的改进方法和b)用于从2d基因表达图像构建3d表示的新方法来扩展和推进所提出的概念。这些3d基因表达“图像”可以可视化,供研究人员研究感兴趣基因的表达,但也可以作为集成数据集进行分析,以鉴别新的疾病机制、靶点和生物标志物。

5、已经描述了使用所谓的slide-seq技术以高空间分辨率进行的全基因组表达分析(rodriquez等人,science 363,1463-1467(2019);wo 2019/213254a1)。在slide-seq方法中,将唯一dna条形码化的10mm微粒(“珠粒”)堆积在涂有橡胶的玻璃盖玻片上,以形成称为“捕获片(puck)”的单层。

6、在下文中,术语“条形码”是指用于明确鉴别微粒的分子标签。

7、这些捕获片用于捕获从组织冷冻切片中释放的mrna。然后使用solid(通过寡核苷酸连接和检测进行测序)化学分析所捕获的mrna。

8、villacappa等人(https://doi.org/10.1101/2020.07.24.219758)描述了福尔马林固定石蜡包埋(ffpe)组织中的全基因组空间表达谱分析。该程序利用成熟的、商业上可获得的成像和空间条形码方法,使用带有条形码化oligo(dt)探针斑点的载玻片来捕获组织切片中的mrna分子的3'端。


技术实现思路

1、本专利技术旨在提供三维表达数据。本专利技术的一般原理是将来自二维成像技术(优选显微镜成像)的数据与来自测序技术的数据组合,随后获得所述数据的3d可视化。因此,本专利技术的方法基于类似于slideseq技术的技术,即使用冷冻切片和/或villacappa等人的方法(loc.cit.),即使用ffpe切片,如上所述,然而,本专利技术特别考虑了样品的三维性质。

2、可以在本专利技术的情形中使用的其他合适的基本技术包括高分辨率空间转录组学(high-definition spatial transcriptomics,hdst)(vickovic等人,nature methods16:987-990(2019))和visium技术(10x genomics;例如wo 2012/140224a1,wo 2014/060483a1)。

3、一般,为了分析组织样品的基因表达模式,可以结合测序技术使用基于显微镜的捕获片成像。然而,这样的组合会产生两种不同类型的数据:

4、(1)成像数据,所述成像数据在对捕获片(以下也称为“阵列结构”)成像以在其上配准珠粒位置时获得;和

5、(2)测序数据,所述测序数据量化每个珠粒中的基因表达。

6、因此,本专利技术的目的是提供一种改进的方法和系统,以匹配两种不同类型的数据。进一步的目的是提供组织样品的基因表达模式的高度自动化的、空间分辨的3d可视化和分析。

7、上述目的通过独立权利要求的主题得以解决。从属权利要求涉及本专利技术的进一步方面。

8、本专利技术的优选的方面涉及在mrna水平上分析基因表达。然而,在进一步的实施方案中,本专利技术适用于通过使用寡核苷酸标记的抗体来检测组织中的空间蛋白质分布。为了检测组织切片中的蛋白质,将组织切片与抗体孵育,所述抗体用dna条形码标记,所述dna条形码包含对每个抗体特异的鉴别序列和寡a序列。在与抗体温育和洗涤后,dna标签可以结合到oligodt包被的珠粒上。结合的抗体dna标签也被转换为下一代测序文库,该文库能够对捕获片上每个位置的抗体进行定量,其用作每个位置处的蛋白质计数的指标。

9、因此,本专利技术广泛地涉及一种用于分析来自受试者的组织样品中的生物大分子(优选rna、dna或蛋白质,更优选含poly-a的rna如mrna)的空间丰度的方法,包括以下步骤:

10、(a)提供所述组织样品的多个连续切片,优选冷冻切片,

11、(b)通过对每个阵列结构在固体载体上沉积平均直径为1至100μm的珠粒来产生多个阵列结构(“捕获片”),

12、其中每个珠粒包含至少1000个连接的寡核苷酸,并且其中每个珠粒的至少1000个连接的寡核苷酸中的每一个包含:

13、(i)珠粒鉴别序列,所述珠粒鉴别序列是每个珠粒上全部至少1000个寡核苷酸共有的并且在各自的阵列结构中对每个珠粒是唯一的,以及

14、(ii)生物大分子特异性捕获序列,优选寡核苷酸序列,例如poly-t序列,以捕获所述样品中的生物大分子,

15、(c)通过使用显微镜执行边合成边测序技术,为每个阵列结构鉴别所述珠粒鉴别序列以及沉积在固体载体上的珠粒中的单个珠粒在固体载体上的相关二维位置,

16、(d)将多个阵列结构中的每个阵列结构与所述组织样品的多个切片中的一个切片接触并透化组织切片,从而通过连接在珠粒上的所述捕获序列捕获所述样品中的生物大分子,

17、(e)对每个阵列结构,鉴别与珠粒的寡核苷酸结合的生物分子以及针对每个待鉴别的生物大分子的相关珠粒鉴别序列,

18、(f)为每个阵列结构匹配在步骤(c)和(e)中确定的珠粒鉴别序列,其中阵列结构中的二维位置被分配给每个捕获的生物分子的身份(例如在rna基础上的序列),

19、(g)对在步骤(f)中获得的连续切片的二维序列数据进行比对,从而从组织样品中获得空间可分辨的生物大分子丰度数据,其中所述比对包括对在步骤(f)中获得的连续切片的二维序列数据中的一个或多个参考生物分子(即,通常为参考基因产物,例如mrna或蛋白质)进行转换。

20、步骤(g)中的术语转换是指任何计算方法,优选计算机视觉方法,更优选本文档来自技高网...

【技术保护点】

1.一种用于以计算机实现的组织样品中含poly-A的RNA空间丰度分析的方法,所述方法包括以下步骤:

2.根据权利要求1所述的方法,所述方法还包括以所述组织样品的三维表示将输出可视化的步骤。

3.根据权利要求1或2所述的方法,其中步骤1)以包含以下步骤的方法执行:

4.一种数据处理系统,其包含用于执行权利要求1至3所述的方法的步骤的装置。

5.一种包含指令的计算机程序产品,当所述程序由计算机执行时,所述指令使计算机执行权利要求1至3所述的方法的步骤。

6.一种计算机可读的存储介质,其包含当由计算机执行时使计算机执行权利要求1至3所述的方法的步骤的指令。

7.一种分析受试者组织样品中含poly-A的RNA空间丰度的方法,其包括以下步骤:

8.根据权利要求7所述的方法,其中所述含poly-A的RNA是mRNA。

9.根据权利要求7至8所述的方法,其中所述珠粒的平均直径为1至30μm,优选所述珠粒的平均直径为1至10μm,更优选为10μm。

10.根据权利要求7至3所述的方法,其中所述固体载体的直径为1至100mm,优选为1至40mm,更优选为1至10mm,甚至更优选为约3mm。

11.根据权利要求7至4所述的方法,其中所述固体载体是粘合塑料或玻璃表面或聚二甲基硅氧烷PDMS基质。

12.根据权利要求7至5所述的方法,其中每个珠粒包含1×103至1×109个连接的寡核苷酸,优选1×105至1×108个连接的寡核苷酸,更优选1×107至1×108个连接的寡核苷酸,甚至更优选约3×107个连接的寡核苷酸,和/或其中寡核苷酸是DNA寡核苷酸。

13.根据权利要求7至12所述的方法,其中所述珠粒是聚苯乙烯、聚甲基丙烯酸甲酯PMMA或玻璃珠粒和/或其中所述珠粒在固体载体上形成单层。

14.根据权利要求7至13所述的方法,其中每个阵列结构包含10000至10000000个珠粒,优选50000至200000个珠粒,更优选约100000个珠粒。

15.根据权利要求7至14所述的方法,其中步骤(e)中RNA分子的测序包括逆转录以获得cDNA,所述cDNA连接至珠粒的寡核苷酸,并通过下一代测序NGS技术对cDNA分子进行测序,优选其中NGS技术是边合成边测序SBS。

16.根据权利要求7至15所述的方法,其中在步骤(f)中使用基于最优传输问题的方法和/或在步骤(g)中使用尺度不变特征转换算法。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于以计算机实现的组织样品中含poly-a的rna空间丰度分析的方法,所述方法包括以下步骤:

2.根据权利要求1所述的方法,所述方法还包括以所述组织样品的三维表示将输出可视化的步骤。

3.根据权利要求1或2所述的方法,其中步骤1)以包含以下步骤的方法执行:

4.一种数据处理系统,其包含用于执行权利要求1至3所述的方法的步骤的装置。

5.一种包含指令的计算机程序产品,当所述程序由计算机执行时,所述指令使计算机执行权利要求1至3所述的方法的步骤。

6.一种计算机可读的存储介质,其包含当由计算机执行时使计算机执行权利要求1至3所述的方法的步骤的指令。

7.一种分析受试者组织样品中含poly-a的rna空间丰度的方法,其包括以下步骤:

8.根据权利要求7所述的方法,其中所述含poly-a的rna是mrna。

9.根据权利要求7至8所述的方法,其中所述珠粒的平均直径为1至30μm,优选所述珠粒的平均直径为1至10μm,更优选为10μm。

10.根据权利要求7至3所述的方法,其中所述固体载体的直径为1至100mm,优选为1至40mm,更优选为1至10mm,甚至更优选为约3m...

【专利技术属性】
技术研发人员:J·爱丽思N·卡拉伊斯科斯N·拉杰夫斯基G·马基诺A·维勒E·泽内尔S·阿比亚蒂S·阿尤布S·埃里格S·普赖比施
申请(专利权)人:马克思德布鲁克分子医学中心亥姆霍兹联合会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1