【技术实现步骤摘要】
一种基于人工智能的细胞类型高精度识别方法
[0001]本专利技术涉及一种基于人工智能的细胞类型高精度识别算法及其实现方法。
技术介绍
[0002]细胞是生物学中的基本单位,它通过参与关键的生物过程以维持生命的正常运作。通过组学数据实现细胞类型的识别,可以为理解组织的结构和功能奠定基础。然而,细胞类型却难以注释,因为细胞类型的一致和严格的定义仍不清楚,传统方法(例如形状和大小、物理外观属性和表面蛋白是否存在)仍然无法准确区分细胞类型。单细胞RNA测序(scRNA
‑
seq)技术彻底改变了生物学研究。与测量大量细胞平均表达的传统转录组数据(Bulk RNA
‑
seq)不同,scRNA
‑
seq分析单个细胞的转录组,从而提供更高分辨率的数据,以更好地了解细胞转录组调控和变异等级。scRNA
‑
seq为探索和解析新的生物学问题提供了途径,例如发现新的、罕见的细胞类型;构建和推理伪时间细胞轨迹等。
[0003]scRNA
‑
seq数据分析 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能的细胞类型高精度识别方法,其特征在于,包括以下步骤:1)对scRNA
‑
seq数据进行预处理;2)基于量子松鼠搜索算法的特征选择方法筛选最优特征子集;3)基于最优特征子集对细胞进行聚类。2.根据权利要求1所述的基于人工智能的细胞类型高精度识别方法,其特征在于,步骤1)中,对scRNA
‑
seq数据进行预处理,具体包括:1.1)去除scRNA
‑
seq读取计数矩阵在任何细胞中都没有计数的基因;1.2)对读取计数矩阵进行归一化和log2转换,得到表达量矩阵;1.3)计算表达量矩阵中每个基因在每个细胞内的离散度,进行归一化后得到基因离散度矩阵;1.4)计算基因离散度矩阵中每个基因的方差,得到每个基因的评分;1.5)根据每个基因的评分选择排名靠前的D个基因,得到高变基因矩阵。3.根据权利要求2所述的基于人工智能的细胞类型高精度识别方法,其特征在于,步骤1.3)中,所述的离散度被定义为基因表达的方差除以基因表达的均值。4.根据权利要求2所述的基于人工智能的细胞类型高精度识别方法,其特征在于,步骤1.5)中,排名靠前是指对每个基因的评分进行倒序排序,评分越高、排名越靠前。5.根据权利要求1所述的基于人工智能的细胞类型高精度识别方法,其特征在于,步骤2)中,基于量子松鼠搜索算法的特征选择方法筛选最优特征子集,具体包括:2.1)用二维矩阵Q={θ
ij
|1≤i≤D,1≤j≤N}表示一个包含N个个体的种群A,D为维度,二维矩阵Q...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。