一种转录因子靶基因关系预测方法、系统、设备和介质技术方案

技术编号:37791701 阅读:24 留言:0更新日期:2023-06-09 09:21
本发明专利技术提供一种转录因子靶基因关系预测方法、系统、设备和介质,方法包括:获取待预测物种编码转录因子的DNA序列和靶基因的DNA序列并编码,得到编码序列;获取待预测物种的蛋白质和遗传相互作用网络数据及转录因子靶基因相互作用网络数据;基于编码序列、蛋白质和遗传相互作用网络数据以及转录因子靶基因相互作用网络数据构建图神经网络模型,并进行模型训练,得到训练后的图神经网络模型;采用训练后的图神经网络模型预测待预测物种未知的转录因子靶基因相互作用关系。本发明专利技术可以避免基因表达数据缺失值多以及结合位点预测不准确的问题;同时,可以根据已有基因调控网络的拓扑结构实现大规模的转录因子

【技术实现步骤摘要】
一种转录因子靶基因关系预测方法、系统、设备和介质


[0001]本专利技术涉及生物信息学
,具体涉及一种基于图神经网络的转录因子靶基因关系预测方法、系统、设备和介质。

技术介绍

[0002]在生命过程中,生物体通过基因表达将遗传信息进行转录和翻译,从而表现出相应的性状。基因的表达过程受到转录因子的调控。基因调控是一个复杂的生物过程,在不同的时间和空间条件下,单个转录因子可以激活或抑制大量下游靶基因的转录,而一个靶基因又可以受到不同转录因子的调控。转录因子的靶基因研究对理解生物体分子机制、生命系统的发育过程和疾病诊断治疗具有重要意义。在基因组学的研究中,有许多实验方法和计算方法可以预测受转录因子调控的靶基因,但目前的方法受制于数据可用性、大规模数据缺乏、基因数目庞大等问题,因而需要新的数据和方法实现靶基因预测。
[0003]现有的预测转录因子靶基因关系的计算方法主要分为根据基因表达水平推测的方法和间接预测转录因子结合位点的方法。转录因子可以调控靶基因表达的上升和下调,使经过转录、翻译产生的蛋白质增多或减少,因而可以利用转录因子与靶基因本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种转录因子靶基因关系预测方法,其特征在于,包括:S1,获取待预测物种编码转录因子的DNA序列和靶基因的DNA序列,并对编码转录因子的DNA序列和靶基因的DNA序列进行编码,得到编码序列;其中,所述转录因子和靶基因的相互作用关系已知;S2,获取待预测物种的蛋白质和遗传相互作用网络数据;其中,所述蛋白质和遗传相互作用网络数据与S1中的转录因子和靶基因相对应;S3,获取待预测物种的转录因子靶基因相互作用网络数据,其中,所述转录因子靶基因相互作用网络数据是S1中所述转录因子和靶基因的相互作用网络数据;S4,基于S1获取的编码序列、S2获取的蛋白质和遗传相互作用网络数据以及S3获取的转录因子靶基因相互作用网络数据构建图神经网络模型,并进行模型训练,得到训练后的图神经网络模型;S5,采用训练后的图神经网络模型预测待预测物种未知的转录因子靶基因相互作用关系。2.根据权利要求1所述的转录因子靶基因关系预测方法,其特征在于,S1中,从NCBI数据库中获取待预测物种编码转录因子的DNA序列和靶基因的DNA序列;S2中,从BioGRID数据库中获取待预测物种的蛋白质和遗传相互作用网络数据。3.根据权利要求1所述的转录因子靶基因关系预测方法,其特征在于,S1中,采用k

mers编码方式对编码转录因子的DNA序列和靶基因的DNA序列进行编码。4.根据权利要求1所述的转录因子靶基因关系预测方法,其特征在于,S4具体为:基于转录因子靶基因相互作用网络数据构建图神经网络模型的调控网络图;将蛋白质和遗传相互作用网络数据与编码序列拼接起来,并使用全连接层提取转录因子和靶基因的特征,进行特征融合,所得融合特征作为调控网络图中基因节点和转录因子节点的特征,构建得到图神经网络模型;对图神经网络模型进行模型训练。5.根据权利要求1所述的转录因子靶基因关系预测方法,其特征在于,S4中,所述图神经网络模型为基于个性化PageRank的图神经网络模型。6.根据权利要求1所述的转录因子靶基因关系预测方法,其特征在于,S5具体为:S51,获取待预测物种编码转录因子的DNA序列和候选靶基因的DNA序列,并对编码...

【专利技术属性】
技术研发人员:马珂郭菲唐继军
申请(专利权)人:深圳理工大学筹
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1