【技术实现步骤摘要】
一种用于单细胞测序数据的癌症亚型基因特征识别方法及系统
[0001]本专利技术涉及生物信息分析
,特别是涉及一种用于单细胞测序数据的癌症亚型基因特征识别方法及系统
。
技术介绍
[0002]单细胞 RNA 测序 (scRNA
‑
seq) 技术已经促进了更多的转录组研究
。
由于传统的
bulk RNA
‑
seq
技术获取一组细胞的平均基因表达,因此在肿瘤样本中识别出的细胞亚群的信息通常是模糊的
。scRNA
‑
seq 可量化单个细胞的基因表达,这有助于分析细胞差异
。
对于癌症相关疾病,
scRNA
‑
seq 能够表征肿瘤内异质性,这有助于研究人员在单细胞层次了解癌症亚型
、
细胞群和细胞功能
。
此外,
scRAN
‑
seq 分析也已被用于研究免疫系统和大脑神经元机制
。
[0003]基于单细胞表达数据 ...
【技术保护点】
【技术特征摘要】
1.
一种用于单细胞测序数据的癌症亚型基因特征识别方法,其特征在于,包括:
S1:
搜集原始真实数据集;
S2: 数据预处理;
S3:
估计潜在癌症亚型的数量;
S4: 设计残差网络,低秩网络和全连接网络,并初始化权重;
S5: 初始化低秩的数量,最大迭代次数和超参;
S6: 预测低秩网络系数和权重;
S7: 计算重构基因表达和原始基因表达之间的误差;
S8: 利用误差更新下一代的网络权重;
S9: 获得潜在亚型对应的低秩网络系数和权重;
S10: 识别各个亚型对应的不同基因特征;
S11: 下游分析,包括差异表达基因分析
、
分类和聚类分析
、
可视化和功能富集分析等
。2.
根据权利要求1所述的一种用于单细胞测序数据的癌症亚型基因特征识别方法,其特征在于,所述进行所述原始真实数据集,具体包括:真实数据
Human melanoma tumor scRNA
‑
seq dataset (GEO access number: GSE72056),
此数据集包含来自
19
个患者的
4645
个单细胞和
23686
个基因
,
其中,
4645
个单细胞由
1257
个恶性黑色素肿瘤细胞和
3388
个良性肿瘤细胞组成
。3.
根据权利要求2所述的一种用于单细胞测序数据的癌症亚型基因特征识别方法,其特征在于,所述数据预处理,具体包括:首先,采用
log
‑
transformation
方法,进行表达量规范化
,
其次,在少于
6%
的细胞中进行表达的基因(稀有基因)和在超过
94% 的细胞中进行表达的基因(普遍存在的基因)被过滤,以此获得
12693
个基因
,
最后,我们使用
EMDomics
工具来识别差异表达基因,以此获得
1170
个差异表达基因
。4.
根据权利要求3所述的一种用于单细胞测序数据的所述的一种用于单细胞测序数据的癌症亚型基因特征识别方法,其特征在于,所述估计潜在癌...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。