基于环挤压模型中转录因子序列预测CTCF染色质环的方法技术

技术编号:43849979 阅读:25 留言:0更新日期:2024-12-31 18:42
本发明专利技术涉及一种基于环挤压模型中转录因子序列预测CTCF染色质环的方法。它解决了现有技术中染色质环预测方法可解释性有限且预测不准确的问题。它包括S1、构建数据集;S2、关键转录因子序列转化;S3、建立基于关键转录因子序列的CTCF染色质环分类模型;S4、模型评估。本发明专利技术的优点在于:仅用关键转录因子序列作为输入,能够实现对CTCF染色质环的预测。创新地将转录因子结合顺序编码为转录因子序列,利用自然语言的预训练BERT模型,解码转录因子序列,实现对CTCF染色质环的预测,提高预测准确率的同时,增强预测模型的可解释性。

【技术实现步骤摘要】

本专利技术涉及医疗保健信息学,具体涉及一种基于环挤压模型中转录因子序列预测ctcf染色质环的方法。


技术介绍

1、现有的预测ctcf染色质环的方法包括基于样本基因组序列和表观基因组特征的机器学习方法(ctcf-mp,loll ipop,ccip)和数学建模方法(lc模型)。现有算法都是基于复杂的基因组序列和表观基因组特征,包括各种dna序列组成、组蛋白修饰、基因表达rna-seq信号、架构蛋白ctcf和rad21的基因组结合信号、环长度、ctcfmot if方向等作为输入,单纯地依赖机器学习或深度学习技术的学习能力,存在黑盒子的问题,可解释性有限。基于简单数学模型往往需要手动选择和构建特征,比如lc模型,这可能会遗漏重要信息,导致预测结果不准确。


技术实现思路

1、本专利技术的目的是针对目前特征模式可解释性较差的染色质环预测方法,提供一种基于环挤压模型中转录因子序列预测ctcf染色质环的方法。

2、为达到上述目的,本专利技术采用了下列技术方案:基于环挤压模型中转录因子序列预测ctcf染色质环的方法本文档来自技高网...

【技术保护点】

1.一种基于环挤压模型中转录因子序列预测CTCF染色质环的方法,其特征在于,本方法包括以下步骤:

2.根据权利要求1所述的基于环挤压模型中转录因子序列预测CTCF染色质环的方法,其特征在于,在步骤S1中,利用Hi-C实验数据检测获得染色质环,通过胰腺细胞分化SC-βorg阶段的转录因子的ChIP-seq数据获取转录因子在基因组中的位置坐标。

3.根据权利要求1所述的基于环挤压模型中转录因子序列预测CTCF染色质环的方法,其特征在于,步骤S1包括以下步骤:

4.根据权利要求3所述的基于环挤压模型中转录因子序列预测CTCF染色质环的方法,其特征在于,步骤S...

【技术特征摘要】

1.一种基于环挤压模型中转录因子序列预测ctcf染色质环的方法,其特征在于,本方法包括以下步骤:

2.根据权利要求1所述的基于环挤压模型中转录因子序列预测ctcf染色质环的方法,其特征在于,在步骤s1中,利用hi-c实验数据检测获得染色质环,通过胰腺细胞分化sc-βorg阶段的转录因子的chip-seq数据获取转录因子在基因组中的位置坐标。

3.根据权利要求1所述的基于环挤压模型中转录因子序列预测ctcf染色质环的方法,其特征在于,步骤s1包括以下步骤:

4.根据权利要求3所述的基于环挤压模型中转录因子序列预测ctcf染色质环的方法,其特征在于,步骤s11包括以下步骤:

5.根据权利要求4所述的基于环挤压模型中转录因子序列预测ctcf染色质环的方法,其特征在于,步骤s2具体包括以下步骤:

6.根据权利要求1所述的基于环挤压模型中转录因子序列预测ctcf...

【专利技术属性】
技术研发人员:刘利齐意萱邹权林昊
申请(专利权)人:电子科技大学长三角研究院衢州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1