本申请实施例提供了一种核酸结合位点的检测方法及装置,其中,该方法包括:获取目标蛋白质的目标属性信息,其中,目标属性信息用于指示目标蛋白质的空间结构;根据目标属性信息确定目标蛋白质中所包括的氨基酸序列的全局特征,其中,全局特征用于表征氨基酸序列中氨基酸之间的关联关系;从全局特征中提取目标局部特征,其中,目标局部特征用于表征氨基酸序列中所存在的氨基酸残基之间的关联关系;根据目标局部特征检测目标蛋白质中的核酸结合位点,得到目标核酸结合位点。通过本申请,解决了相关技术中存在的蛋白质中的核酸结合位点检测效率较低的问题,达到提高蛋白质中的核酸结合位点检测效率的效果。合位点检测效率的效果。合位点检测效率的效果。
【技术实现步骤摘要】
核酸结合位点的检测方法及装置
[0001]本申请实施例涉及数据处理领域,具体而言,涉及一种核酸结合位点的检测方法及装置。
技术介绍
[0002]蛋白质是细胞的功能分子,由α
‑
氨基酸残基长链条组成,参与许多生命活动,例如激素调节、代谢、感知、细胞转录和复制等。通常蛋白质并不是“孤军奋战”,绝大多数蛋白质会与其他生物分子(蛋白质、DNA(Deoxyribo Nucleic Acid,脱氧核糖核酸)、RNA(Ribo nucleic Acid,核糖核酸)等),或者金属离子(Mg2+,Zn2+,Fe3+,Ca2+等)相互作用,一起参与生命的过程。其中和DNA或RNA的相互作用的蛋白质包括组蛋白、转录因子、甲基化酶和染色质重塑复合物等,控制了DNA或RNA剪切、DNA或RNA复制、DNA或RNA转录的过程,是基因转录调控的关键,影响细胞的分裂和蛋白质的生成,可以说是一切生命活动的基础。因此研究蛋白质
‑
DNA或RNA相互作用具有重要的意义。
[0003]当前,在预测整个蛋白质是否能和DNA或RNA发生相互作用时大多先使用滑动窗口的方法提取残基特征,再对残基一个一个的进行预测,预测该残基与DNA或RNA的相互作用可能性,这种方式一方面效率比较低,每次只能检测一个残基,另一方面,由于蛋白质的螺旋状空间结构的复杂性,可能会出现检测出的结果并不准确,偏离实际情况。
技术实现思路
[0004]本申请实施例提供了一种核酸结合位点的检测方法及装置,以至少解决相关技术中存在的蛋白质中的核酸结合位点检测效率较低的问题。
[0005]根据本申请的一个实施例,提供了一种核酸结合位点的检测方法,包括:获取目标蛋白质的目标属性信息,其中,所述目标属性信息用于指示所述目标蛋白质的空间结构;根据所述目标属性信息确定所述目标蛋白质中所包括的氨基酸序列的全局特征,其中,所述全局特征用于表征所述氨基酸序列中氨基酸之间的关联关系;从所述全局特征中提取目标局部特征,其中,所述目标局部特征用于表征所述氨基酸序列中所存在的氨基酸残基之间的关联关系;根据所述目标局部特征检测所述目标蛋白质中的核酸结合位点,得到目标核酸结合位点。
[0006]可选的,所述根据所述目标属性信息确定所述目标蛋白质序列的全局特征,包括:将所述目标属性信息输入至目标特征生成网络,其中,所述目标特征生成网络用于根据所述氨基酸序列中氨基酸之间的位置信息生成所述氨基酸序列中氨基酸之间的关联关系;获取所述目标特征生成网络输出的所述全局特征。
[0007]可选的,所述将所述目标属性信息输入至目标特征生成网络,包括:将所述目标属性信息输入至目标位置编码层,得到目标位置特征,其中,所述目标特征生成网络包括所述目标位置编码层和多头注意力编码层,所述目标位置编码层用于在输入的属性信息中添加氨基酸位点之间的位置信息得到位置特征;将所述目标位置特征输入所述多头注意力编码
层,其中,所述多头注意力编码层输出所述全局特征,所述多头注意力编码层用于通过多头注意力编码生成氨基酸之间的关联关系。
[0008]可选的,所述将所述目标属性信息输入至目标位置编码层,得到目标位置特征,包括:通过所述目标位置编码层对所述目标属性信息中包括的所述目标蛋白质上每个氨基酸位点的位点信息进行正余弦位置编码,得到每个所述氨基酸位点的参考位置特征;通过所述目标位置编码层将全部所述氨基酸位点的参考位置特征以及所述目标属性信息相加,得到所述目标位置特征。
[0009]可选的,所述从所述全局特征中提取目标局部特征,包括:将所述全局特征输入至目标卷积网络,其中,所述目标卷积网络用于从所述全局特征中筛选出所述目标局部特征;获取所述目标卷积网络输出的所述目标局部特征。
[0010]可选的,所述将所述全局特征输入至目标卷积网络,包括:通过所述目标卷积网络使用目标卷积核对所述全局特征进行卷积运算,得到参考局部特征;通过所述目标卷积网络使用门控线性单元GLU对所述参考局部特征进行筛选,得到所述目标局部特征。
[0011]可选的,在根据所述目标属性信息确定所述目标蛋白质中所包括的氨基酸序列的全局特征之前,所述方法还包括:构建初始检测模型,其中,所述初始检测模型包括依次连接的初始特征生成网络,初始卷积网络和初始全连接网络;使用标注了核酸结合位点的蛋白质样本对所述初始检测模型进行训练,得到目标检测模型,其中,所述目标检测模型包括依次连接的目标特征生成网络,目标卷积网络和目标全连接网络,所述目标特征生成网络用于根据所述目标属性信息确定所述全局特征,所述目标卷积网络用于从所述全局特征中提取所述目标局部特征,所述目标全连接网络用于根据所述目标局部特征检测所述目标蛋白质中的核酸结合位点得到目标核酸结合位点。
[0012]可选的,所述使用标注了核酸结合位点的蛋白质样本对所述初始检测模型进行训练,得到目标检测模型,包括:将所述蛋白质样本输入所述初始检测模型,得到所述初始检测模型输出的检测结果;根据所述检测结果和所述蛋白质样本所标注的核酸结合位点对所述初始检测模型中初始层的模型参数进行调整,直至所述初始检测模型收敛,得到所述目标检测模型,其中,所述初始层包括:所述初始特征生成网络所包括的初始位置编码层和初始多头注意力编码层,以及,所述初始卷积网络所包括的初始卷积核和初始门控线性单元。
[0013]可选的,所述获取目标蛋白质的目标属性信息,包括:分别获取所述目标蛋白质的位置特异性打分矩阵,以及,所述目标蛋白质中每个氨基酸的理化特征和二级结构信息,其中,所述二级结构信息用于指示所述目标蛋白质中每个氨基酸位点上的氨基酸形成蛋白质二级结构的概率值;分别将每个氨基酸的所述理化特征和所述二级结构信息添加至所述位置特异性打分矩阵中与所对应的氨基酸位点对应的位置上,得到目标矩阵作为所述目标属性信息。
[0014]根据本申请的另一个实施例,提供了一种核酸结合位点的检测装置,包括:获取模块,用于获取目标蛋白质的目标属性信息,其中,所述目标属性信息用于指示所述目标蛋白质的空间结构;确定模块,用于根据所述目标属性信息确定所述目标蛋白质中所包括的氨基酸序列的全局特征,其中,所述全局特征用于表征所述氨基酸序列中氨基酸之间的关联关系;提取模块,用于从所述全局特征中提取目标局部特征,其中,所述目标局部特征用于表征所述氨基酸序列中所存在的氨基酸残基之间的关联关系;检测模块,用于根据所述目
标局部特征检测所述目标蛋白质中的核酸结合位点,得到目标核酸结合位点。
[0015]根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0016]根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0017]通过本申请,由于目标蛋白质的目标属性信息用于指示本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种核酸结合位点的检测方法,其特征在于,包括:获取目标蛋白质的目标属性信息,其中,所述目标属性信息用于指示所述目标蛋白质的空间结构;根据所述目标属性信息确定所述目标蛋白质中所包括的氨基酸序列的全局特征,其中,所述全局特征用于表征所述氨基酸序列中氨基酸之间的关联关系;从所述全局特征中提取目标局部特征,其中,所述目标局部特征用于表征所述氨基酸序列中所存在的氨基酸残基之间的关联关系;根据所述目标局部特征检测所述目标蛋白质中的核酸结合位点,得到目标核酸结合位点。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标属性信息确定所述目标蛋白质序列的全局特征,包括:将所述目标属性信息输入至目标特征生成网络,其中,所述目标特征生成网络用于根据所述氨基酸序列中氨基酸之间的位置信息生成所述氨基酸序列中氨基酸之间的关联关系;获取所述目标特征生成网络输出的所述全局特征。3.根据权利要求2所述的方法,其特征在于,所述将所述目标属性信息输入至目标特征生成网络,包括:将所述目标属性信息输入至目标位置编码层,得到目标位置特征,其中,所述目标特征生成网络包括所述目标位置编码层和多头注意力编码层,所述目标位置编码层用于在输入的属性信息中添加氨基酸位点之间的位置信息得到位置特征;将所述目标位置特征输入所述多头注意力编码层,其中,所述多头注意力编码层输出所述全局特征,所述多头注意力编码层用于通过多头注意力编码生成氨基酸之间的关联关系。4.根据权利要求3所述的方法,其特征在于,所述将所述目标属性信息输入至目标位置编码层,得到目标位置特征,包括:通过所述目标位置编码层对所述目标属性信息中包括的所述目标蛋白质上每个氨基酸位点的位点信息进行正余弦位置编码,得到每个所述氨基酸位点的参考位置特征;通过所述目标位置编码层将全部所述氨基酸位点的参考位置特征以及所述目标属性信息相加,得到所述目标位置特征。5.根据权利要求1所述的方法,其特征在于,所述从所述全局特征中提取目标局部特征,包括:将所述全局特征输入至目标卷积网络,其中,所述目标卷积网络用于从所述全局特征中筛选出所述目标局部特征;获取所述目标卷积网络输出的所述目标局部特征。6.根据权利要求2所述的方法,其特征在于,所述将所述全局特征输入至目标卷积网络,包括:通过所述目标卷积网络使用目标卷积核对所述全局特征进行卷积运算,得到参考局部特征;通过所述目标卷积网络使用门控线性单元GLU对所述参考局部特征进行筛选,得到所
述目标局部特征。7.根据权利要求1所述的方法,其特征在于,在根据所述目标属性信息确定所述目标蛋白质中所包括的氨基酸序列的全局特征之前,所述方法还包括:构建初始检测模型,其中,所述初始检测模型包括...
【专利技术属性】
技术研发人员:郄瑜,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。