当前位置: 首页 > 专利查询>山东大学专利>正文

基于变分图自编码器的空间组学数据补全方法及系统技术方案

技术编号:46612261 阅读:0 留言:0更新日期:2025-10-14 21:10
本发明专利技术提出了基于变分图自编码器的空间组学数据补全方法及系统,涉及生物信息学技术领域。提取数据对中部分共有的基因,得到特征矩阵;基于空间位置信息,得到空间转录组学测序数据中细胞的第一子邻接矩阵;基于基因表达相似性,分别得到单细胞RNA测序数据中细胞的第二子邻接矩阵和数据对中细胞的第三子邻接矩阵;将第一子邻接矩阵、第二子邻接矩阵和第三子邻接矩阵合并,得到最终的邻接矩阵;将特征矩阵和最终的邻接矩阵输入至预训练的变分图自编码器网络中,完成对空间转录组学缺失基因的补全。本发明专利技术能够有效利用空转数据细胞间的位置信息和基因表达特征,不仅可以降低误差,同时还可以提高补全基因与真实值的相似性。

【技术实现步骤摘要】

本专利技术属于生物信息学,尤其涉及基于变分图自编码器的空间组学数据补全方法及系统


技术介绍

1、随着空间转录组学技术的飞速发展,研究者能够在保留组织空间结构的同时,获取高分辨率的基因表达谱,为解析组织微环境、细胞间互作用及疾病异质性提供了关键工具。该技术通过将空间坐标信息与转录组数据精准整合,突破了传统单细胞测序技术丢失空间定位的瓶颈。目前主流的空间转录组技术可分为基于测序和基于影像两大类,其分辨率已从组织层级提升至亚细胞级,部分技术甚至可实现单细胞级精度,为生物医学研究提供了新的视角和方法。

2、在进行细胞间相互作用分析和细胞类型鉴定等任务时,需达到单细胞级别的精度,尽管基于影像的空间转录组技术通过结合高分辨率组织切片影像与测序数据,实现了单细胞分辨率的基因表达测量。但这类技术因探针设计和成像技术限制等问题,常导致可同时测量的基因数目有限,严重制约了数据完整性与下游分析的可靠性。现有研究已经在探索空间域上进行了大量的探索,并取得了优异的成绩,然而这些方法大多数最终均基于knn生成最终的预测结果,批次效应校正方法、相似性度量和邻居数选择的最优本文档来自技高网...

【技术保护点】

1.基于变分图自编码器的空间组学数据补全方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于变分图自编码器的空间组学数据补全方法,其特征在于,所述预处理,包括过滤单细胞RNA测序数据中表达均值小于设定值的基因,并对数据对中的基因表达数据进行归一化和对数转换。

3.如权利要求1所述的基于变分图自编码器的空间组学数据补全方法,其特征在于,所述第一子邻接矩阵、第二子邻接矩阵和第三子邻接矩阵的具体计算方式为:

4.如权利要求1所述的基于变分图自编码器的空间组学数据补全方法,其特征在于,还包括对变分图自编码器网络进行预训练,具体过程为

5....

【技术特征摘要】

1.基于变分图自编码器的空间组学数据补全方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于变分图自编码器的空间组学数据补全方法,其特征在于,所述预处理,包括过滤单细胞rna测序数据中表达均值小于设定值的基因,并对数据对中的基因表达数据进行归一化和对数转换。

3.如权利要求1所述的基于变分图自编码器的空间组学数据补全方法,其特征在于,所述第一子邻接矩阵、第二子邻接矩阵和第三子邻接矩阵的具体计算方式为:

4.如权利要求1所述的基于变分图自编码器的空间组学数据补全方法,其特征在于,还包括对变分图自编码器网络进行预训练,具体过程为:

5.如权利要求4所述的基于变分图自编码器的空间组学数据补全方法,其特征在于,将基因表达矩阵分别与三个掩码矩阵相乘,实现训练集、空转测试集和单细胞测试集的划分,所述三个掩码矩阵具体包括训练掩码矩阵、空转掩...

【专利技术属性】
技术研发人员:张威魏明月刘治平高瑞原致远谯旭黎雯瑞
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1