一种基于图注意自动编码器的单细胞类型注释方法技术

技术编号:41726704 阅读:18 留言:0更新日期:2024-06-19 12:50
一种基于图注意自动编码器的单细胞类型注释方法,所述图注意自动编码器由数据预处理模块、GTAE模块和互相关解码器模块组成;S1,先使用scanpy工具将原始基因表达矩阵进行预处理,然后使用KNN算法对scRNA‑seq数据进行构图从而得到输入图;使用无向图屏蔽策略对上述输入图进行图屏蔽处理从而得到扰动图;S2,将步骤S1中得到的输入图和扰动图送入GTAE模块,两者会作为融合注意力机制的图自动编码器的输入,经过迭代优化,最终得到参考数据集的潜在特征表示,并保存为pth权重文件;S3,加载步骤S2中得到的pth权重文件,将预处理过的查询数据集,作为互相关解码器的输入,最终输出细胞类型注释结果。本发明专利技术的方法能够提高数据类型注释的准确性和一致性。

【技术实现步骤摘要】

本专利技术涉及细胞类型注释,尤其涉及一种基于图注意自动编码器的单细胞类型注释方法


技术介绍

1、单细胞组学技术的出现使得分析生物样本中的单个细胞成为可能,从而提供对生物系统更详细的洞察。在这一技术中,精准确定每个细胞的细胞类型是scrna-seq分析的核心目标。尽管许多注释算法已经取得了显著进展,但是scrna-seq数据经常面临高维数、稀疏度和标签不一致性等挑战,使得直接处理这些数据变得复杂,影响了数据类型注释的准确性。

2、近年来,涌现出多种细胞类型注释方法,比如基于参考查询的注释方法。首先,通过对参考数据集和查询数据集的基因表达谱进行相似度计算,推断出查询数据集中的细胞类型。其次,基于机器学习的模型在有标签的数据上进行训练,然后在无标签的数据集上进行细胞类型注释。然而,参考数据集和查询数据集之间的批次效应可能会妨碍对细胞类型的正确标注。

3、随着深度学习的迅速发展,深度学习框架广泛应用于细胞类型注释。自动编码器也是一种备受欢迎的细胞类型注释方法,然而自动编码器通常关注于学习数据的特征,会忽略了数据的集合结构信息。

...

【技术保护点】

1.一种基于图注意自动编码器的单细胞类型注释方法,其特征在于:所述图注意自动编码器由数据预处理模块、GTAE模块和互相关解码器模块组成;基于图注意自动编码器的单细胞类型注释方法包括以下步骤:

2.根据权利要求1所述的一种基于图注意自动编码器的单细胞类型注释方法,其特征在于:在步骤S1中,所述预处理步骤包括质量控制、滤除低质量的细胞和基因、对数标准化、选择高度可变基因作为特征以及矩阵缩放。

3.根据权利要求1所述的一种基于图注意自动编码器的单细胞类型注释方法,其特征在于:在步骤S1中,使用无向图屏蔽策略来扰动输入图时,对于一个图中任一节点满足以下分布:

...

【技术特征摘要】

1.一种基于图注意自动编码器的单细胞类型注释方法,其特征在于:所述图注意自动编码器由数据预处理模块、gtae模块和互相关解码器模块组成;基于图注意自动编码器的单细胞类型注释方法包括以下步骤:

2.根据权利要求1所述的一种基于图注意自动编码器的单细胞类型注释方法,其特征在于:在步骤s1中,所述预处理步骤包括质量控制、滤除低质量的细胞和基因、对数标准化、选择高度可变基因作为特征以及矩阵缩放。

3.根据权利要求1所述的一种基于图注意自动编码器的单细胞类型注释方法,其特征在于:在步骤s1中,使用无向图屏蔽策略来扰动输入图时,对于一个图中任一节点满足以下分布:

4.根据权利要求3所述的一种基于图注意自动编码器的单细胞类型注释方法,其特征在于:在步骤s2中,给...

【专利技术属性】
技术研发人员:李重毛梦林李国栋
申请(专利权)人:湖州师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1