一种基于卷积神经网络预测哺乳动物家畜增强子序列的装置制造方法及图纸

技术编号:39645138 阅读:17 留言:0更新日期:2023-12-09 11:12
本发明专利技术公开了一种基于卷积神经网络预测哺乳动物家畜增强子序列的装置

【技术实现步骤摘要】
一种基于卷积神经网络预测哺乳动物家畜增强子序列的装置、方法及计算机可读存储介质


[0001]本专利技术属于生物信息学领域,具体涉及一种基于卷积神经网络预测哺乳动物家畜增强子序列的装置

方法及计算机可读存储介质


技术介绍

[0002]随着测序技术的不断更新与优化,以及
GWAS
研究的不断累积,越来越多的与复杂性状表型关联位点被鉴别并得到了初步的遗传调控机制解析,但大量的
GWAS
显著位点位于基因组的非编码调控区,难以进行更加深入的机制解析

[0003]Olivia
等研究发现
GWAS
显著位点绝大多数位于非编码区,可能作用的机制是由于非编码区的功能片段发生改变,从而影响到基因的表达,进而对表型产生影响

[0004]基因非编码区的功能片段可分为两类:顺式作用元件和反式作用因子

顺式作用元件是指具有调节转录起始和效率功能的特异
DNA
序列片段,如启动子

增强子等本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
鉴定或辅助鉴定哺乳动物家畜增强子序列的装置,其特征在于:所述装置包括如下模块:
M1、
数据收集模块:用于获得哺乳动物家畜已知增强子序列数据和哺乳动物家畜已知非增强子序列数据;
M2、
数据预处理模块:用于将所述哺乳动物家畜已知增强子序列数据和所述哺乳动物家畜已知非增强子序列数据进行去冗余,得到去冗余增强子序列数据和去冗余非增强子序列数据,将所述去冗余增强子序列数据和所述去冗余非增强子序列数据进行合并得到基准数据集;
M3、
序列编码模块:用于将所述基准数据集使用独热编码得到
One

hot
编码数据集,将所述基准数据集使用
K

mer
编码得到
K

mer
编码数据集,将所述
One

hot
编码数据集与所述
K

mer
编码数据集进行合并,得到模型输入数据集;
M4、
增强子序列预测模型获得模块:用于将所述模型输入数据集作为输入数据,基于卷积神经网络构建初始预测模型,并对所述初始预测模型进行训练优化获得增强子序列预测模型;
M5、
鉴定模块:用于将哺乳动物家畜的待鉴定基因序列使用所述增强子序列预测模型进行预测分类,根据所述预测分类的结果确定所述待鉴定基因序列是否为增强子序列
。2.
根据权利要求1所述的装置,其特征在于:
M4
所述增强子序列预测模型获得模块包括如下模块:
M4

1)
模型构建模块:用于将所述模型输入数据集作为输入数据输入到卷积层进行增强子序列特征提取;使用批量归一化层稳定模型训练的过程;使用线性层对所述输入数据进行分类,获得初始预测模型;
M4

2)
模型训练模块:用于将所述初始预测模型使用五折交叉验证训练获得增强子序列预测模型
。3.
根据权利要求1或2所述的装置,其特征在于:
M1
中所述哺乳动物家畜已知非增强子序列数据通过包括如下步骤的方法获得:基于基因组注释文件获得所述哺乳动物家畜的基因区域信息,基于所述基因区域信息筛选获得所述已知非增强子序列
。4.
根据权利要求1‑3中任一权利要求所述的装置,其特征在于:
M3
所述序列编码模块中所述
k

mer

k
值设置为
1、2
和3三种
。5.
鉴定或辅助鉴定哺乳动物家畜增强子序列的方法,其特征在于:所述方法包括如下步骤:
N1、
数据收集:获得哺乳动物家畜已知增强子序列数据和哺乳动物家畜已知非增强子序列数据;
N2、
数据预...

【专利技术属性】
技术研发人员:吴克亮王冀赵兴波张涵刘哲熹曾彤艾晓华
申请(专利权)人:中国农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1