一种q-HMM和规则相结合的蛋白质二级结构预测方法技术

技术编号:36729114 阅读:24 留言:0更新日期:2023-03-04 09:54
本发明专利技术公开了一种q

【技术实现步骤摘要】
一种q

HMM和规则相结合的蛋白质二级结构预测方法


[0001]本专利技术属于蛋白质二级结构预测领域,特别是一种q

HMM和规则相结合的蛋白质二级结构预测方法。

技术介绍

[0002]自人类基因组计划在上世纪末正式启动后,科学家们前仆后继地攻克难关,终于在本世纪初完成了人类基因图谱的绘制,人类自此进入后基因组时代,而蛋白质组研究是后基因组时代生命科学中最重大的研究课题之一。想要研究蛋白质组,首要的任务是研究其功能与结构。在科学界普遍的认知是,蛋白质二级结构预测是蛋白质整体结构预测的先驱。蛋白质二级结构是指,多肽主链骨架原子沿一定的轴盘旋或折叠而形成的特定的构象,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。
[0003]蛋白质二级结构的主要形式包括α

螺旋、β

折叠、β

转角和无规则卷曲。由于蛋白质的分子量较大,所以一个蛋白质分子的不同肽段可能含有不同形式的二级结构。一种蛋白质的二级结构并非单纯的α

螺旋或β本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种q

HMM和规则相结合的蛋白质二级结构预测方法,其特征在于,包括以下步骤:步骤1、建立q

HMM(量子

隐马尔可夫模型):定义蛋白质二级结构状态序列集合S、蛋白质一级结构观测序列集合V、q

HMM中的状态转移张量A、q

HMM中的发射张量B、q

HMM中的初始张量π;步骤2、提取关联规则:定义关联规则参数,计算提取蛋白质二级结构规则的置信度与支持度,对比置信度与支持度的阈值产生频繁项集,最终得到强关联规则;步骤3、使用统计方法求解q

HMM参数:使用Baum

Welch算法对q

HMM模型参数进行迭代计算,并利用重估公式得到q

HMM中的状态转移张量A、q

HMM中的发射张量B、q

HMM中的初始张量π;步骤4、结合关联规则使用模型参数进行双向预测:根据步骤2得到的强关联规则,确定蛋白质二级结构预测的起始位置;利用蛋白质序列片段以及步骤3得到的q

HMM中的状态转移张量A、q

HMM中的发射张量B、q

HMM中的初始张量π,并结合Viterbi算法进行双向迭代,预测得出整条蛋白质二级结构链。2.根据权利要求1所述q

HMM和规则相结合的蛋白质二级结构预测方法,其特征在于,步骤1中蛋白质二级结构状态序列集合S={s1,s2,

,s
i


s
N
},其中s
i
表示蛋白质二级结构的一种状态;蛋白质一级结构观测序列表示为集合V={v1,v2,

,v
j


,v
M
},其中v
j
表示一种氨基酸;q

HMM中的状态转移张量其中为状态转移张量A的每一维度的分量,表示满足在某个t位置的前n个状态值及前m个观测值已经确定的的条件下,转移到第t位置的状态值为i的概率;q

HMM中的发射张量其中为发射张量B的每一维度的分量,表示满足在第t位置的前n个状态值及前m个观测值已经确定的的条件下,转移到第t位置的观测值为k的概率;q

HMM中的初始张量其中为初始张量π的每一维度的分量,表示所有满足初始位置的n个状态值在已知m个观测值条件的蛋白质序列的概率。3.根据权利要求1所述q

【专利技术属性】
技术研发人员:唐千清张琬沁张雨柔姚洪亮姚洪达
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1