基于分布与知识对齐的单细胞多组学细胞类型注释方法技术

技术编号:46372751 阅读:5 留言:0更新日期:2025-09-15 12:50
本发明专利技术提供了一种基于分布与知识对齐的单细胞多组学细胞类型注释方法,属于单细胞类型注释技术领域,该方法包括获取单细胞转录组数据和单细胞染色质可及性测序数据,并对多组学变分自编码器模型进行预训练及训练,其中,多组学变分自编码器模型结合变分自编码器和知识蒸馏技术,通过分布与知识对齐整合和注释多组学单细胞数据。利用已训练的多组学变分自编码器模型对同时输入的单细胞转录组数据和单细胞染色质可及性测序数据进行细胞类型预测。本发明专利技术解决了仅依赖单一组学的方法的局限性问题,增强组学之间的协同作用,提升了注释的准确性,以及通过知识蒸馏,减少了计算开销。

【技术实现步骤摘要】

本专利技术属于单细胞类型注释,尤其涉及一种基于分布与知识对齐的单细胞多组学细胞类型注释方法


技术介绍

1、单细胞类型注释对于理解肿瘤微环境至关重要。随着单细胞测序技术的进步,研究人员现在可以在单细胞水平上分析不同细胞类型的功能特征。然而,现有的注释方法难以处理单细胞数据中的高维稀疏性和技术噪声。传统方法主要依赖转录组数据,忽略了互补的多组学信息,导致信息丢失和准确性降低。而现有的多组学方法,由于模型的复杂性,大多需要很高的训练和预测成本。

2、随着scatac-seq等新兴技术的出现,多组学测序方法获得了显著关注,提供了前所未有的机会用于多维数据的整合分析。通过结合转录组学和表观基因组学等不同的组学维度,多组学数据能更加全面地理解细胞调控网络,并更精确地表征细胞状态和功能。然而,多组学数据固有的高维性、稀疏性和分布异质性为整合分析带来了困难。解决这些困难需要开发有效的计算模型,能够协调多组学数据集之间的分布,同时捕捉它们的共享特征。这仍然是当前研究的一个重点。

3、现有的多组学数据整合策略大致可以分为两种范式。第一种是数据层面的整本文档来自技高网...

【技术保护点】

1.一种基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述多组学变分自编码器模型的预训练过程如下:

3.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述潜在表示ZRNA通过以下公式生成:

4.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述KL散度损失的公式如下:

5.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,所述跨组学特...

【技术特征摘要】

1.一种基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述多组学变分自编码器模型的预训练过程如下:

3.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述潜在表示zrna通过以下公式生成:

4.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述kl散度损失的公式如下:

5.根据权利...

【专利技术属性】
技术研发人员:贺锶函张永清李天豪何天元王梓鉴黄铮骁王紫轩刘宇航吴晨芃
申请(专利权)人:成都信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1