当前位置: 首页 > 专利查询>吉林大学专利>正文

基于图对比神经网络的单细胞组学数据嵌入表示提取方法技术

技术编号:43533276 阅读:20 留言:0更新日期:2024-12-03 12:17
基于图对比神经网络的单细胞组学数据嵌入表示提取方法属生物信息学与机器学习交叉技术领域,本发明专利技术使用基于zinb的自编码器架构,以应对单细胞数据中的高维、稀疏和噪声挑战;引入聚类引导的对比学习,能有效地提升正负样本的质量;通过自表达计算模块,利用细胞的共表达模式和全局相似性,将单细胞数据映射到更内聚的嵌入空间;进一步利用学习到的自表达矩阵优化KNN图结构,显著减少误差累积,可提高对比学习中图的构建质量。本发明专利技术的应用将有助于有效的捕获单细胞转录组数据中存在的亚群,为生物信息学研究提供一种新的工具。

【技术实现步骤摘要】

本专利技术属于生物信息学与机器学习交叉,具体涉及基于图对比神经网络的单细胞组学数据嵌入表示提取方法


技术介绍

1、单细胞聚类在单细胞数据的下游分析中发挥着至关重要的作用,它根据细胞的表达模式对细胞进行分类,从而对单个细胞的复杂性和功能提供更深入的了解。由于单细胞深度嵌入表示模型能够同时获取特征表示和执行聚类,因此在单细胞聚类任务中得到了广泛的应用。然而,由于单细胞数据具有高维度、稀疏性和噪声的特性存在,以及单细胞数据中缺乏细胞类型标签,对于单细胞深度嵌入表示的提取任务仍然存在挑战。

2、为了应对上述挑战,近些年大多使用一种基于零膨胀负二项分布的自编码器来对原始的单细胞表达数据进行建模和特征提取,其中由于零膨胀负二项分布能更好地捕捉到数据的零膨胀和稀疏性的特性,因此可以为单细胞数据提供更准确的概率分布拟合,后续很多的模型也沿用了基于零膨胀负二项分布的自编码器这一架构。然而,这些方法仅依赖原始的基因表达,却忽略了细胞之间的关系。

3、为了更好地整合基因表达信息与细胞间的关系信息,一些方法利用图神经网络来进行特征提取。然而基于图神经网络本文档来自技高网...

【技术保护点】

1.一种基于图对比神经网络的单细胞组学数据嵌入表示提取方法,其特征在于,包括下列步骤:

【技术特征摘要】

1.一种基于图对比神经网络的单细胞组学数据嵌...

【专利技术属性】
技术研发人员:丰小月曹博雯管仁初曾安
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1