一种基于卷积神经网络的细胞反卷积预测方法技术

技术编号:32247710 阅读:63 留言:0更新日期:2022-02-09 17:51
本发明专利技术公开了一种基于卷积神经网络的细胞反卷积预测方法,该方法属于细胞反卷积预测领域。使用卷积神经网络技术从单细胞RNA测序数据中推测组织的细胞类型组成比例,与传统的细胞反卷积算法相比,解决了传统反卷积需要进行复杂的数据预处理,并需要设计数学算法对单细胞测序数据进行规范化等弊端。本发明专利技术设计的卷积神经网络可以从单细胞RNA测序数据中提取出隐藏特征,并且网络节点对数据的噪音和误差具有很高的鲁棒性,并充分挖掘了各个基因之间的内在联系,因而提高了细胞反卷积性能,同时模型是建立在神经网络的基础上的,与传统的线性模型,机器学习等方法相比,模型结构直观易于理解,并且具有更好的反卷积性能和高度的扩展性。展性。展性。

【技术实现步骤摘要】
一种基于卷积神经网络的细胞反卷积预测方法


[0001]本专利技术主要涉及基于单细胞RNA测序数据的下游分析领域,主要是关于一种细胞反卷积方法,特别是涉及到一种基于卷积神经网络的对单细胞RNA测序数据进行细胞反卷积方法。

技术介绍

[0002]随着高通量测序技术被广泛的运用在生物和医学领域,近年来开发的单细胞RNA测序技术可以对单个细胞进行无偏、可重复、高分辨率和高通量的转录分析。传统的测序技术是基于群体细胞进行测序,反映出的是一群细胞的平均表达值,并不能揭示不同细胞之间的异质性。而单细胞RNA测序技术可以研究单个细胞表达谱,从而避免单个细胞的基因表达值被群体的平均值所掩盖,以揭示复杂细胞群体的异质性。单细胞RNA测序技术对单个细胞的全部RNA进行提取、逆转录、扩增和测序得到单细胞RNA测序数据,对测序数据的分析可以揭示生物组织的细胞构成、发现罕见的细胞群、探究细胞组分的变化等。
[0003]细胞反卷积是单细胞RNA测序数据下游分析的一个方面,细胞反卷积即从组织样本的单细胞RNA测序数据中推断出该组织存在的细胞类型及比例,这可用于发现新的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的细胞反卷积方法,包括以下步骤:(1)使用单细胞RNA测序数据模拟人工组织,确定一个模拟人工组织中的细胞总数K和需要生成的人工组织个数Q;从单细胞RNA测序数据中抽取K个细胞,合并抽取细胞的基因表达矩阵形成模拟人工组织的基因表达矩阵为模拟组织的特征,并记录该组织各个类型细胞所占比例作为该组织的标记信息, 为某细胞类型占该组织的细胞比例数;t为该组织细胞类型数目;所述的K为大于1的正整数,Q为大于1的正整数;(2)对步骤(1)所得的模拟人工组织进行特征筛选,并对每个特征执行转化到对数空间和归一化操作,通过以上处理,得到数据集;(3)对步骤(2)中得到的数据集,数据集若来源于s个不同数据集,将其分为训练集和测试集进行s折交叉验证,训练集由s

1个来源不同的数据组成,测试集由剩下的1个来源的部分数据组成,确定batch size的大小,在训练集中随机抽取batch size个数据作为一次训练的输入数据;(4)从步骤(3)中输入数据中获得组织的细胞类型数目t作为该卷积神经网络的全连接模块中最后一层神经元的个数,构建卷积神经网络模型Cbccon,确定模型的学习率learning rate,模型训练测次数step,模型的优化算法optimized algorithm;将步骤(3)中的作为一次训练的数据输入Cbccon模型中进行模型训练,得到预测的组织细胞比例(1≤i≤t)为训练集预测的某细胞类型占该组织的细胞比例数;通过公式计算细胞比例预测值和真实值之间计算损失函数,是该组织真实的细胞分数标签,是训练集该组织细预测的细胞比例,利用优化算法对损失函数进行优化;依据步骤(3)中再随机抽取step

1次的继续训练,训练完毕后,保存训练好的Cbccon模型中参数;(5)使用步骤(4)中训练好的Cbccon模型进行数据预测,将输入训练好的模型中,得到预测结果即预测的测试集的组织细胞类型比例(1≤i≤t)为测试集数据中预测的某细胞类型占该组织的细胞比例数。2.根据权利要求1所述的基于卷积神经网络的细胞反卷积方法,其特征在于:所述的K为100

5000,所述的Q为1000

100000。3.根据权利要求1所述的基于卷积神经网络的细胞反卷积方法,其特征在于:步骤(1)
中所述的使用单细胞RNA测序数据进行模拟包括以下步...

【专利技术属性】
技术研发人员:刘振栋吕欣荣戴琼海李冬雁陈曦杨玉荣秦梦颖柏苛刘芳含何志强李晓峰季向阳刘烨斌胡国胜李国文
申请(专利权)人:山东建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1