一种基于深度压缩感知的空间转录组方法及装置制造方法及图纸

技术编号:39038212 阅读:11 留言:0更新日期:2023-10-10 11:51
本发明专利技术属于分子生物学和生物信息学领域,提供了一种自编码器,包含所述自编码器的压缩感知模型CSNet,基于深度学习的压缩感知方法,以及基于深度压缩感知的空间转录组方法及装置。基于本发明专利技术的基于深度压缩感知的空间转录组方法csFISH重构的数据不仅与smFISH技术相近,而且本发明专利技术成像所用时间仅仅是smFISH技术的1/28。并且,本发明专利技术的csFISH方法不仅可以只进行少量的采样即可恢复高维数据,还克服了光学拥挤的难题,能够用低倍镜更快速地成像。该方法在保证高质量数据的同时,极大提升了成像速度。速度。速度。

【技术实现步骤摘要】
一种基于深度压缩感知的空间转录组方法及装置


[0001]本专利技术涉及一种空间转录组方法和装置,特别是涉及一种基于深度压缩感知的空间转录组方法及装置,属于分子生物学和生物信息学领域。

技术介绍

[0002]空间转录组技术是一种用于研究组织中基因表达的新兴组学技术,能够捕获细胞层面的基因表达图谱并保留组织的位置信息。它是对特定性质的细胞类型、组织或器官内的转录本表达进行全面和系统研究的方法,并且不会失去细胞在组织中的空间位置信息。相比于传统的转录组技术,空间转录组技术可以获得细胞在组织生理环境下真实的基因表达特征,并且此技术能够探明细胞与微环境之间的关系,有助于加深对正常和病理状态下细胞特性的理解。因此,它成为了分子生物学和生物医学领域重要的研究方法之一。
[0003]目前,主流的空间转录组技术主要分为两类:基于下一代测序的空间转录组技术和基于原位成像的空间转录组技术。其中,原位成像技术又可分为基于原位杂交的空间转录组技术和基于原位测序的空间转录组技术。
[0004]基于下一代测序的空间转录组技术利用芯片给组织切片中的RNA添加空间位置信息,之后再进行测序并重构其空间分布。这一类技术目前已有多个商业化产品,包括美国10X公司的Visium技术、Slide

seq技术和华大的Stereo

seq技术等。
[0005]虽然,Visium技术、Slide

seq技术和Stereo

seq技术具有各自的优点,但是,基于下一代测序的空间转录组技术不能同时具有高空间分辨率与高测序深度的特点,难以获取高质量的单细胞精度的数据。同时,其成本随样品数目线性增加,不利于大规模样品的实验。
[0006]主流的基于原位成像的空间转录组技术通过结合荧光原位杂交(FISH)技术和显微成像技术,能够实现对单个细胞中不同mRNA转录本的定位和统计,从而得到单细胞水平的空间转录组信息。其中,FISH技术是利用核酸探针对目标mRNA转录本进行特异性的标记并搭配荧光物质进行检测;而显微成像技术则是通过高分辨率的成像设备对这些荧光信号进行捕获;然后使用图像分析算法进行图像处理,得到每个细胞中mRNA的准确位置,即“亚细胞精度”信息;最后使用细胞分割算法识别和统计每一个细胞中的mRNA数量,从而获得空间转录组信息。
[0007]smFISH技术、seqFISH技术和MERFISH技术是目前使用较为普遍的基于原位成像的空间转录组技术。但是,在基于原位成像的空间转录组技术中,基因通量与成像速度不能兼得。smFISH技术基因通量低;seqFISH技术采用编码方案,能够测量的基因数最多,但是由于受到光学衍射极限的限制,存在光学拥挤的问题;而MERFISH技术为了避免光学拥挤的问题,降低了编码压缩率,采用了更高标准的光学仪器来获得高分辨率图像,所需成像时间较长。
[0008]因此,本领域亟需一种新的空间转录组技术,其既能兼顾基因通量和成像速度,也能避免光学拥挤的问题。

技术实现思路

[0009]本专利技术针对现有技术中存在的上述缺陷,提供一种自编码器,其是将输出恢复成输入的神经网络结构,包含编码器和解码器,其中:
[0010]编码器是由一个线性压缩层组成的神经网络,将高维数据转换为低维表示,实现数据的压缩;
[0011]解码器由多个全连接层组成,其采用残差网络ResNet作为网络结构,将压缩后的数据重构成原始输入数据,实现数据的重构。
[0012]在本专利技术优选的实施方案中,所述自编码器通过最小化输入x和输出之间的误差同时完成压缩和重构两个步骤,其中,
[0013]编码器的线性压缩层可以将基因表达矩阵X通过与采样矩阵A进行矩阵乘法进行线性变换得到复合测量矩阵Y,其中A是m
×
g的二维矩阵,X是g
×
n的二维矩阵,Y是m
×
n的二维矩阵,编码器的输出可以表示为如下公式,
[0014]Y=AX
[0015]通过所述公式,编码器将高维的输入数据转换为低维的线性表示,在数据采集时实现压缩;
[0016]解码器将编码器的输出结果Y作为解码器的输入,通过如下公式,重构基因表达矩阵
[0017]。
[0018]本专利技术另一方面提供了一种基于深度学习的压缩感知模型CSNet,其包含本专利技术所述的自编码器。
[0019]本专利技术另一方面提供了一种基于深度学习的压缩感知方法,其将深度学习技术应用到压缩感知中,包括以下步骤:
[0020]1、构建本专利技术所述的自编码器,或者本专利技术所述的模型CSNet;
[0021]2、采用步骤1构建的自编码器或模型CSNet进行模型训练和推理,在进行模型训练中,通过反向传播算法更新网络权重以最小化损失函数。
[0022]在本专利技术优选的实施方案中,步骤2包含编码器和解码器联合训练、解码器单独训练和解码器推理三个过程。
[0023]在本专利技术优选的实施方案中,步骤2中的模型训练包括训练步骤、验证步骤以及测试步骤。
[0024]在本专利技术优选的实施方案中,使用基于PyTorch开发的Pytorch

Lightning高级框架来实现该压缩感知算法。
[0025]在本专利技术优选的实施方案中,步骤2在进行模型训练之前,还包括对数据进行处理的步骤,更加优选对复合测量矩阵进行归一化和对数转换。
[0026]本专利技术另一方面提供了本专利技术所述的自编码器或者本专利技术所述的模型CSNet在基于深度学习的压缩感知方法中的应用。
[0027]本专利技术另一方面提供了一种基于深度压缩感知的空间转录组方法,包括以下步骤:
[0028]1、模型构建,构建本专利技术所述的自编码器,或者本专利技术所述的模型CSNet;
[0029]2、模型训练,获得训练好的模型和采样矩阵;
[0030]3、组织成像,进行荧光原位杂交成像实验得到数据图像;
[0031]4、数据重构,从图像中提取复合测量矩阵并输入压缩感知模型中重构基因表达矩阵。
[0032]在本专利技术优选的实施方案中,步骤2通过单细胞数据集训练模型,得到采样方案。
[0033]在本专利技术优选的实施方案中,步骤2还包括根据皮尔逊相关系数指标和聚类指标ARI选择最优的模型参数和采样矩阵。
[0034]在本专利技术优选的实施方案中,步骤3还包括对图像进行滤波去噪以及图像处理步骤,所述图像处理优选为对图像进行归一化、拼接、对齐和分割。
[0035]在本专利技术优选的实施方案中,步骤4还包括对对经过图像处理得到的复合测量矩阵进行预处理的步骤,所述预处理优选为进行归一化和对数转换。
[0036]本专利技术另一方面提供了本专利技术所述的自编码器或者本专利技术所述的模型在基于深度压缩感知的空间转录方法中的应用。
[0037]本专利技术再一方面提供了一种基于深度压缩感知的空间转录组装置,包括以下模块:
[0038]1、模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自编码器,其是将输出恢复成输入的神经网络结构,包含编码器和解码器,其中:编码器是由一个线性压缩层组成的神经网络,将高维数据转换为低维表示,实现数据的压缩;解码器由多个全连接层组成,其采用残差网络ResNet作为网络结构,将压缩后的数据重构成原始输入数据,实现数据的重构。2.根据权利要求1所述的自编码器,其通过最小化输入x和输出之间的误差同时完成压缩和重构两个步骤,其中,编码器的线性压缩层可以将基因表达矩阵X通过与采样矩阵A进行矩阵乘法进行线性变换得到复合测量矩阵Y,其中A是m
×
g的二维矩阵,X是g
×
n的二维矩阵,Y是m
×
n的二维矩阵,编码器的输出可以表示为如下公式,Y=AX通过所述公式,编码器将高维的输入数据转换为低维的线性表示,在数据采集时实现压缩;解码器将编码器的输出结果Y作为解码器的输入,通过如下公式,重构基因表达矩阵解码器将编码器的输出结果Y作为解码器的输入,通过如下公式,重构基因表达矩阵。3.一种基于深度学习的压缩感知模型CSNet,其包含权利要求1或2所述的自编码器。4.一种基于深度学习的压缩感知方法,其将深度学习技术应用到压缩感知中,包括以下步骤:(1)构建权利要求1或2所述的自编码器,或者权利要求3所述的模型CSNet;(2)采用步骤(1)构建的自编码器或模型CSNet进行模型训练和推理,在进行模型训练中,通过反向传播算法更新网络权重以最小化损失函数。5.根据权利要求4所述的方法,其中步骤(2)包含编码器和解码器联合训练、解码器单独训练和解码器推理三个过程。6.根据权利要求4或5所述的方法,步骤(2)中的模型训练包括训练步骤、验证步骤以及测试步骤。7.根据权利要求4

6中任一项所述的方法,其使用基于PyTorch开发的Pytorch

Lightning高级框架来实现该压缩感知算法。8.根据权利要求4

7中任一项所述的方法,在进行模型训练之前,还包括对数据进行处理的步骤,优选对复合测量矩阵进行归一化和对数转换。9.权利要求1或2所述的自编码器或者权利要求3所述的模型CSNet在基于深度学习的压缩感知方法中的应用。10.一种基于深度压缩感知的空间转录组方法,包括以下步骤:(...

【专利技术属性】
技术研发人员:瞿昆林俊蒋辰
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1