一种识别DNA序列中超级增强子与典型增强子的预测方法技术

技术编号：44971707 阅读：30 留言：0更新日期：2025-04-12 01:46

本发明专利技术公开了一种识别DNA序列中超级增强子与典型增强子的预测方法，采用整数编码和k‑mer编码方案进行编码，使用残差连接的卷积神经网络提取序列的局部特征，使用两个双向长短期记忆网络提取序列的多尺度全局特征。利用注意力机制将这些局部特征和全局特征进行特征融合，然后输入到全连接神经网络中得到预测概率。采用五折交叉验证的评估方式对模型性能进行评估，使用准确率（ACC）、召回率（REC）、精度（PRE）、F1分数（F1）、ROC曲线下面积（AUC）等五个评估指标衡量模型；独立测试集上的实验结果表明，相比于最先进的方法，我们的模型在识别超级增强子与典型增强子上有了显著的性能提升。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及生物信息学中序列分析的功能位点的预测，具体是一种识别 dna序列中超级增强子与典型增强子的预测方法。

技术介绍

1、超级增强子是人类基因组上具有高富集转录因子和辅因子结合的调控区域，负责定义细胞身份和控制基因转录调控。它们通常基于特定的拼接距离将多个典型增强子拼接在一起，从而跨越一个大的基因组域。构成超级增强子的典型增强子与基因组上其他地方的正常增强子相似，并且被假设在参与基因转录调控方面协同起作用。准确预测超级增强子序列有助于研究与癌症和阿尔茨海默病等各种疾病相关的突变。因此，探索基于 dna序列的超级增强子与典型增强子的识别具有重要意义。

2、针对超级增强子与典型增强子的识别研究，在过去很长一段时间里，增强子的预测依赖于生物实验技术。然而，由于两个主要原因，通过实验方法确定超级增强剂仍然具有挑战性。首先，目前在所有已知的组织/细胞类型中进行 chip 分析以绘制超级增强子是费时费力的。其次，在某些细胞类型中可能缺乏针对超增强子相关标记的特异性抗体，限制了超增强子鉴定实验方法的进一步应用。一些计算方法...

【技术保护点】

1.一种识别DNA序列中超级增强子与典型增强子的预测方法，其过程包括如下步骤：

2.该方法采用整数编码和k-mer编码方案进行编码，使用残差连接的卷积神经网络提取序列的局部特征，使用两个双向长短期记忆网络提取序列的多尺度全局特征。利用注意力机制将这些局部特征和全局特征进行特征融合，然后输入到全连接神经网络中得到预测概率。

3.根据权利要求1所述的一种识别超级增强子与典型增强子的预测方法，其特征在于步骤2）和步骤3）中所述的特征编码方案和模型构建，模型通过整合局部和多尺度全局特征，获得了高性能的预测结果。

【技术特征摘要】

1.一种识别dna序列中超级增强子与典型增强子的预测方法，其过程包括如下步骤：

2.该方法采用整数编码和k-mer编码方案进行编码，使用残差连接的卷积神经网络提取序列的局部特征，使用两个双向长短期记忆网络提取序列的多尺度全局特征。利用注意力机制将这些局部...

【专利技术属性】
技术研发人员：樊永显，王晨，祝杨丰，郑梦鑫，孙贵聪，李雪萍，郭智，汤毅，吴泽恒，邱凯，杨毓琪，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人