RNA制造技术

技术编号:39592820 阅读:5 留言:0更新日期:2023-12-03 19:47
本申请提供一种

【技术实现步骤摘要】
RNA测序数据的校正方法、装置、电子设备及存储介质


[0001]本申请涉及
RNA
测序
,具体涉及一种
RNA
测序数据的校正方法

装置

电子设备及存储介质


技术介绍

[0002]转录组测序(
RNA_seq
)技术基于第二代高通量
DNA
测序技术,提供了单碱基水平的全转录本信息,转录组测序技术发展到现在,已经成为了分子生物学领域中不可或缺的工具

如今,
RNA

seq
技术被广泛的应用于基因表达定量

转录起始位点识别

非编码
RNA
功能鉴定以及单细胞分析等多个领域

[0003]高通量测序数据的积累,使得对大量公共转录组测序数据进行集成分析,从中发现生物学规律变得更加可行,但如何校正大规模数据集中的由批次效应产生的噪声数据成为了首要的问题


技术实现思路

[0004]为了解决上述技术问题,本申请提供一种
RNA
测序数据的校正方法

装置

电子设备及存储介质

[0005]根据本申请实施例的第一方面,提供了一种
RNA
测序数据的校正方法,包括:利用预先构建的校正模型,对
RNA
测序数据进行校正处理,获得校正后的
RNAr/>测序数据,其中,所述对
RNA
测序数据进行校正处理,用于消除所述
RNA
测序数据中的噪声数据;所述校正模型基于对变分自编码器的训练获得;所述变分自编码器包括所述校正模型,所述变分自编码器用于提取
RNA
测序样本中的噪声信息分布和校正后的
RNA
测序样本中的生物学信息分布,并结合所述噪声信息分布和所述生物学信息分布,对所述
RNA
测序样本进行解码还原处理,获得还原后的
RNA
测序样本;所述变分自编码器,至少基于所述还原后的
RNA
测序样本和所述
RNA
测序样本,以及针对所述噪声信息分布和所述生物学信息的判别结果训练得到;其中,针对所述噪声信息分布和所述生物学信息分布的判别,包括:判别所述噪声信息分布中的噪声信息和生物学信息,以及判别所述生物学信息分布中的噪声信息和生物学信息

在本申请的一种可选实施方式中,所述校正模型,包括:第一编码器和第一解码器;
[0006]利用预先构建的校正模型,对
RNA
测序数据进行校正处理,获得校正后
RNA
测序数据,包括:利用所述第一编码器对所述
RNA
测序数据进行生物学维度的编码处理,获得所述
RNA
测序数据的生物学信息分布;利用所述第一解码器对所述生物学信息分布进行解码还原处理,获得所述校正后的
RNA
测序数据

[0007]在本申请的一种可选实施方式中,所述校正模型通过以下方式进行训练:
对所述
RNA
测序样本进行噪声维度的编码处理,获得所述
RNA
测序样本的噪声信息分布;对所述校正后的
RNA
测序样本进行编码处理,获得所述
RNA
测序样本的生物学信息分布;对所述噪声信息分布和所述生物学信息分布进行联合解码还原处理,获取还原后的
RNA
测序样本;基于所述
RNA
测序样本与所述还原后的
RNA
测序样本之间的差异,对所述变分自编码器进行优化,以训练所述校正模型

[0008]在本申请的一种可选实施方式中,所述对所述
RNA
测序样本进行噪声维度的编码处理,获得所述
RNA
测序样本的噪声信息分布;对所述校正后的
RNA
测序样本进行编码处理,获得所述
RNA
测序样本的生物学信息分布;对所述噪声信息分布和所述生物学信息分布进行联合解码还原处理,获取还原后的
RNA
测序样本,包括:利用第二编码器对所述
RNA
测序样本进行噪声维度的编码处理,获得所述
RNA
测序样本的噪声信息分布;利用第三编码器对所述校正后的
RNA
测序样本进行编码处理,获得所述
RNA
测序样本的生物学信息分布;利用第二解码器对所述噪声信息分布和所述生物学信息分布进行联合解码还原处理,获取还原后的
RNA
测序样本

[0009]在本申请的一种可选实施方式中,还包括:利用第一噪声信息判别器,分别对所述噪声信息分布和所述生物学信息分布进行判别处理,获得针对所述噪声信息分布中的噪声信息的第一判别结果,以及针对所述生物学信息分布中的噪声信息的第二判别结果;利用第一生物学信息判别器,分别对所述噪声信息分布和所述生物学信息分布进行判别处理,获得针对所述噪声信息分布中的生物学信息的第三判别结果,以及针对所述生物学信息分布中的生物学信息的第四判别结果;基于所述第一判别结果

所述第二判别结果

所述第三判别结果,以及所述第四判别结果,对第一编码器和所述第二编码器进行优化,以训练所述校正模型

[0010]在本申请的一种可选实施方式中,还包括:基于所述噪声信息分布与先验假设之间的差异,以及所述生物学信息分布与先验假设之间的差异,对所述变分自编码器进行优化,以训练所述校正模型;其中,所述先验假设为正态分布

[0011]在本申请的一种可选实施方式中,还包括:利用第二生物学信息判别器,对所述
RNA
测序样本和所述校正后的
RNA
测序样本的生物学信息进行判别,获得针对所述
RNA
测序样本的第五判别结果和针对所述校正后的
RNA
测序样本的第六判别结果;利用第二噪声信息判别器,对所述
RNA
测序样本和所述校正后的
RNA
测序样本的噪声信息进行判别,获得针对所述
RNA
测序样本的第七判别结果和针对所述校正后的
RNA
测序样本的第八判别结果;基于所述第五判别结果

第六判别结果

第七判别结果,以及第八判别结果,对所
述变分自编码器进行优化,以训练所述校正模型

[0012]在本申请的一种可选实施方式中,还包括:获取
RNA
测序数据集,所述
RNA
测序数据集中包括多个校正处理后的
RNA
测序数据;对所述多个校正后的
RNA...

【技术保护点】

【技术特征摘要】
1.
一种
RNA
测序数据的校正方法,其特征在于,包括:利用预先构建的校正模型,对
RNA
测序数据进行校正处理,获得校正后的
RNA
测序数据,其中,所述对
RNA
测序数据进行校正处理,用于消除所述
RNA
测序数据中的噪声数据;所述校正模型基于对变分自编码器的训练获得;所述变分自编码器包括所述校正模型,所述变分自编码器用于提取
RNA
测序样本中的噪声信息分布和校正后的
RNA
测序样本中的生物学信息分布,并结合所述噪声信息分布和所述生物学信息分布,对所述
RNA
测序样本进行解码还原处理,获得还原后的
RNA
测序样本;所述变分自编码器,至少基于所述还原后的
RNA
测序样本和所述
RNA
测序样本,以及针对所述噪声信息分布和所述生物学信息的判别结果训练得到;其中,针对所述噪声信息分布和所述生物学信息分布的判别,包括:判别所述噪声信息分布中的生物学信息和噪声信息,以及判别所述生物学信息分布中的生物学信息和噪声信息
。2.
根据权利要求1所述的方法,其特征在于,所述校正模型,包括:第一编码器和第一解码器;利用预先构建的校正模型,对
RNA
测序数据进行校正处理,获得校正后
RNA
测序数据,包括:利用所述第一编码器对所述
RNA
测序数据进行生物学维度的编码处理,获得所述
RNA
测序数据的生物学信息分布;利用所述第一解码器对所述生物学信息分布进行解码还原处理,获得所述校正后的
RNA
测序数据
。3.
根据权利要求1所述的方法,其特征在于,所述校正模型通过以下方式进行训练:对所述
RNA
测序样本进行噪声维度的编码处理,获得所述
RNA
测序样本的噪声信息分布;对所述校正后的
RNA
测序样本进行编码处理,获得所述
RNA
测序样本的生物学信息分布;对所述噪声信息分布和所述生物学信息分布进行联合解码还原处理,获取还原后的
RNA
测序样本;基于所述
RNA
测序样本与所述还原后的
RNA
测序样本之间的差异,对所述变分自编码器进行优化,以训练所述校正模型
。4.
根据权利要求3所述的方法,其特征在于,所述对所述
RNA
测序样本进行噪声维度的编码处理,获得所述
RNA
测序样本的噪声信息分布;对所述校正后的
RNA
测序样本进行编码处理,获得所述
RNA
测序样本的生物学信息分布;对所述噪声信息分布和所述生物学信息分布进行联合解码还原处理,获取还原后的
RNA
测序样本,包括:利用第二编码器对所述
RNA
测序样本进行噪声维度的编码处理,获得所述
RNA
测序样本的噪声信息分布;利用第三编码器对所述校正后的
RNA
测序样本进行编码处理,获得所述
RNA
测序样本的生物学信息分布;利用第二解码器对所述噪声信息分布和所述生物学信息分布进行联合解码还原处理,获取还原后的
RNA
测序样本
。5.
根据权利要求4所述的方法,其特征在于,还包括:
利用第一噪声信息判别器,分别对所述噪声信息分布和所述生物学信息分布进行判别处理,获得针对所述噪声信息分布中的噪声信息的第一判别结果,以及针对所述生物学信息分布中的噪声信息的第二判别结果;...

【专利技术属性】
技术研发人员:钱坤李若男刘万飞林强崔鹏
申请(专利权)人:中国农业科学院深圳农业基因组研究所岭南现代农业科学与技术广东省实验室深圳分中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1