【技术实现步骤摘要】
本专利技术涉及生物信息
,尤其是涉及一种预测蛋白质在RNA病毒基因中的结合位点的方法。
技术介绍
从1868年F.Miescher发现核素到1953年沃森和克里克正式提出DNA分子的双螺旋结构,再到2005年人类基因组计划测序工作的完成,人类在探索生命奥秘的道路上留下了一串串坚实的脚印。然而近年来随着对RNA分子研究的不断深入,人们逐步意识到RNA具有远比DNA复杂得多的结构和功能上的多样性,RNA研究已经成为新的热点,一个崭新的RNA世界正在逐渐展现在人们的面前。病毒是地球上最丰富的微生物之一,它是由一个核酸分子与蛋白质构成的非细胞结构形态的靠寄生生活的生命体,根据遗传物质的不同可以分为:DAN病毒和RAN病毒。近年来,由RNA病毒引起的新发或再发性流行病经常成为全球性公共卫生问题,例如轮状病毒、艾滋病病毒、SARS病毒、埃博拉病毒(EBOV)、甲型H1N1流感病毒等。病毒基因组的复制与表达是研究病毒致病机理及研制抗病毒药物的核心,RNA病毒特别是单链RNA病毒,依靠其遗传物质不稳定、基因组进化速度非常快的特点,给疫苗的研制带来巨大的挑战。据悉,从1967年在德国的马尔堡首次发现埃博拉病毒到如今已接近五十年,埃博拉病毒曾造成多次大爆发,人体感染初期出现头痛,肌痛、恶心、呕吐、腹泻等,随后可能出现体内外出血、中枢神经紊乱,最终导致死亡,严重威胁着人类的健康和生命。生物信息学是将计算机科学和数学应用于分子生物学而形成的交叉学科,在基因组的研究中发挥着重要的作用。它将从实验室得到的生物学信息转化为计算机能够处理的数字信息,通过对实验数据加工、存储、检索 ...
【技术保护点】
一种预测蛋白质在RNA病毒基因中的结合位点的方法,用于获取RNA病毒基因序列被选为蛋白质结合位点的概率,其特征在于,该方法包括以下步骤:1)获取多条RNA病毒基因序列;2)以设定的单位长度对每条所述RNA病毒基因序列进行位点信息量计算并比较,获得最大位点信息量及该最大位点信息量所对应的位点信息,根据所述位点信息获得结合位点,其中,所述位点信息量的计算公式为:Hl=-Σbl=A,C,G,Tp(bl)ln[p(bl)/p0(bl)]]]>Hseq=Σl=1SHl]]>式中,Hl是位点中每个位置的信息量,Hseq是位点信息量,bl表示碱基,有A、C、G、T四种碱基,p(bl)是各位置中碱基出现的概率,p0(bl)是基因组中碱基出现的概率,S是位点中位置的个数。
【技术特征摘要】
1.一种预测蛋白质在RNA病毒基因中的结合位点的方法,用于获取RNA病毒基因序列被选为蛋白质结合位点的概率,其特征在于,该方法包括以下步骤:1)获取多条RNA病毒基因序列;2)以设定的单位长度对每条所述RNA病毒基因序列进行位点信息量计算并比较,获得最大位点信息量及该最大位点信息量所对应的位点信息,根据所述位点信息获得结合位点,其中,所述位点信息量的计算公式为: H l = - Σ b l = A , C , G , T p ( b l ) l n [ p ( b l ) / p 0 ( b l ) ] ]]> H s e q = Σ l = 1 S ...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。