【技术实现步骤摘要】
本专利技术涉及生物信息数据的分析方法,是一种计算机对空间转录组数据特征选择及聚类方法,属于生物信息学领域。
技术介绍
1、通过研究特征提取与聚类领域的算法,对空间转录组进行空间域划分即聚类。由于空间转录组的基因数量巨大,我们最先遇到的问题便是数据点缺失,并不是每一个细胞或者细胞群的每一个基因都可以被检测到,这个时候数据就出现错误了,而最好的解决这个问题的方法就是做特征提取,通常情况下我们使用的是pca或者svg作为空间转录组数据的特征提取方式,但这些方法可能无法捕捉到数据的所有重要特征;并且另一个问题就是,空间转录组数据的庞大必然带来的一个不好的问题就是数据的稀疏,很多细胞或者细胞群的基因并不表达,这个时候我们就需要利用图去聚合周围邻居的节点信息。
2、因此,本专利技术隶属于科技部国家重点研发课题(2021yff1201203),重点研究生物医学知识图谱自动构建和更新技术体系,主要对基于图卷积变分自编码器对空间转录组数据进行特征提取和聚类,克服了以上的问题并且能够更好的对空间域进行划分。
技术实现
本文档来自技高网...【技术保护点】
1.一种计算机对空间转录组数据特征选择及聚类方法,其特征在于:包括有:步骤一、在对空间转录组数据进行聚类之前,首先需要对所述空间转录组数据进行预处理,所述预处理包括有子步骤:子步骤1:归一化,对所述空间转录组数据归一化,通过将每个基因的表达值减去其平均值并除以其标准差来实现和得到空间转录组数据1,以用于确保所有基因的表达级别在相同的尺度上,从而消除不同基因之间的尺度差异,使得聚类分析准确;子步骤2:对子步骤1处理后的归一化后的空间转录组数据1去除噪声和不相关数据点;在子步骤2中设置阈值得到空间转录组数据2,以只保留表达值高于某个阈值的基因,能提高聚类的准确性,子步骤3
...【技术特征摘要】
1.一种计算机对空间转录组数据特征选择及聚类方法,其特征在于:包括有:步骤一、在对空间转录组数据进行聚类之前,首先需要对所述空间转录组数据进行预处理,所述预处理包括有子步骤:子步骤1:归一化,对所述空间转录组数据归一化,通过将每个基因的表达值减去其平均值并除以其标准差来实现和得到空间转录组数据1,以用于确保所有基因的表达级别在相同的尺度上,从而消除不同基因之间的尺度差异,使得聚类分析准确;子步骤2:对子步骤1处理后的归一化后的空间转录组数...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。