一种基于双路径并行集成决策的DHSs识别预测方法技术

技术编号：37330866 阅读：12 留言：0更新日期：2023-04-21 23:08

本发明专利技术公开一种基于双路径并行集成决策的DHSs识别预测方法，包括步骤一、数据集处理获得训练集和测试集，步骤二、建立iDHS

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双路径并行集成决策的DHSs识别预测方法

[0001]本专利技术涉及位点预测
，尤其涉及一种基于双路径并行集成决策的DHSs识别预测方法。

技术介绍

[0002]遗传学中，对DNase I核酸内切酶的切割过敏的特定染色质区域被称为DNase I超敏位点(DHSs)，DHSs能够提供哺乳动物中转录调控元件和染色质状态的重要信息，多年来，DHSs为确定启动子、增强子、抑制子和基因组控制区等转录调控元件的精确位置担任了可靠的路标；此外，全基因组关联研究(GWAS)确定了许多与癌症、心血管疾病等疾病和性状相关的非编码变体。而这些变体集中在DHSs标记的调节DNA中，因此，准确识别DHSs有助于进一步探究基因的调控与常见疾病的致病机制；
[0003]DNase I超敏位点(DHS)是对DNase I酶的切割表现出超敏反应的染色质区域，它是调节DNA的通用标记，并且与多种疾病和表型性状的遗传变异相关，然而，常规的实验方法识别DHSs耗时且昂贵，而在小鼠不同发育阶段的基因上的DHSs是动态变化的，不同组织的序列也有很大的差异性，单一模型往往难以实现对多类型数据的准确识别，因此，本专利技术提出一种基于双路径并行集成决策的DHSs识别预测方法以解决现有技术中存在的问题。

技术实现思路

[0004]针对上述问题，本专利技术的目的在于提出一种基于双路径并行集成决策的DHSs识别预测方法，该基于双路径并行集成决策的DHSs识别预测方法通过BiGRU
‑
Attention模型和MSFRN...

【技术保护点】

【技术特征摘要】
1.一种基于双路径并行集成决策的DHSs识别预测方法，其特征在于，包括以下步骤：步骤一、数据集处理，获取iDHS
‑
Deep基准数据集中小鼠基因组的DHS序列，再利用CD
‑
HIT对其进行处理后划分获得训练集和测试集；步骤二、模型建立，建立包含特征提取模块、双路径集成模块和输出模块的iDHS
‑
DPPE模型，其中双路径集成模块包含BiGRU
‑
Attention模型和MSFRN模型；步骤三、训练集和测试集统一化处理，将训练集和测试集中的序列长度进行扩充处理，获得统一长度的序列并按照滑动窗口拆分为2
‑
mers，获得扩增后的训练集和测试集；步骤四、特征提取，将扩增后的训练集序列特征作为输入经过iDHS
‑
DPPE模型的特征提取模块进行特征提取，获得提取特征；步骤五、双路径并行训练，将获得的提取特征作为输入分别导入包含BiGRU
‑
Attention模型和MSFRN模型的双路径集成模块中进行训练，并结合特征提取模块和输出模块获得训练后的iDHS
‑
DPPE模型；步骤六、模型测试，将扩增后的测试集同样经过步骤四的特征提取处理，并将获得的提取特征输入训练后的iDHS
‑
DPPE模型进行模型测试，获得测试后的iDHS
‑
DPPE模型；步骤七、模型识别预测，将待测数据经过步骤三和步骤四的处理后输入测试后的iDHS
‑
DPPE模型，并由其输出识别预测结果。2.根据权利要求1所述的一种基于双路径并行集成决策的DHSs识别预测方法，其特征在于：所述步骤一中获取的小鼠基因组的DHS序列包含小鼠不同组织和发育阶段的DHS综...

【专利技术属性】
技术研发人员：吕学平，
申请(专利权)人：安徽大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人