当前位置: 首页 > 专利查询>吉林大学专利>正文

一种计算机对空间转录组数据特征选择及聚类方法技术

技术编号:41846951 阅读:12 留言:0更新日期:2024-06-27 18:25
本发明专利技术涉及一种计算机对空间转录组数据特征选择及聚类方法,隶属于科技部国家重点研发课题(2021YFF1201203),本课题重点研究生物医学知识图谱自动构建和更新技术体系,通过输入空间转录组数据,以变分自编码器作为基础模型结合K‑means聚类,可以有效的对空间转录组数据做聚类。这种方法可以很好的帮助我们理解基因在生物体内的空间分布,从而揭示其生物过程中的作用。

【技术实现步骤摘要】

本专利技术涉及生物信息数据的分析方法,是一种计算机对空间转录组数据特征选择及聚类方法,属于生物信息学领域。


技术介绍

1、通过研究特征提取与聚类领域的算法,对空间转录组进行空间域划分即聚类。由于空间转录组的基因数量巨大,我们最先遇到的问题便是数据点缺失,并不是每一个细胞或者细胞群的每一个基因都可以被检测到,这个时候数据就出现错误了,而最好的解决这个问题的方法就是做特征提取,通常情况下我们使用的是pca或者svg作为空间转录组数据的特征提取方式,但这些方法可能无法捕捉到数据的所有重要特征;并且另一个问题就是,空间转录组数据的庞大必然带来的一个不好的问题就是数据的稀疏,很多细胞或者细胞群的基因并不表达,这个时候我们就需要利用图去聚合周围邻居的节点信息。

2、因此,本专利技术隶属于科技部国家重点研发课题(2021yff1201203),重点研究生物医学知识图谱自动构建和更新技术体系,主要对基于图卷积变分自编码器对空间转录组数据进行特征提取和聚类,克服了以上的问题并且能够更好的对空间域进行划分。


技术实现思路

本文档来自技高网...

【技术保护点】

1.一种计算机对空间转录组数据特征选择及聚类方法,其特征在于:包括有:步骤一、在对空间转录组数据进行聚类之前,首先需要对所述空间转录组数据进行预处理,所述预处理包括有子步骤:子步骤1:归一化,对所述空间转录组数据归一化,通过将每个基因的表达值减去其平均值并除以其标准差来实现和得到空间转录组数据1,以用于确保所有基因的表达级别在相同的尺度上,从而消除不同基因之间的尺度差异,使得聚类分析准确;子步骤2:对子步骤1处理后的归一化后的空间转录组数据1去除噪声和不相关数据点;在子步骤2中设置阈值得到空间转录组数据2,以只保留表达值高于某个阈值的基因,能提高聚类的准确性,子步骤3,对子步骤1和子步骤...

【技术特征摘要】

1.一种计算机对空间转录组数据特征选择及聚类方法,其特征在于:包括有:步骤一、在对空间转录组数据进行聚类之前,首先需要对所述空间转录组数据进行预处理,所述预处理包括有子步骤:子步骤1:归一化,对所述空间转录组数据归一化,通过将每个基因的表达值减去其平均值并除以其标准差来实现和得到空间转录组数据1,以用于确保所有基因的表达级别在相同的尺度上,从而消除不同基因之间的尺度差异,使得聚类分析准确;子步骤2:对子步骤1处理后的归一化后的空间转录组数...

【专利技术属性】
技术研发人员:管仁初武智鹏曾安丰小月
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1