一种预测转录因子结合位点的方法技术

技术编号:6865704 阅读:984 留言:0更新日期:2012-04-11 18:40
本发明专利技术设计了一种预测转录因子结合位点的方法,该方法的基本实施流程如下:步骤1、研究对象的基因组定位;步骤2、基因启动子序列的提取;步骤3、预测转录因子结合位点;步骤4、统计分析预测结果。通过该方法,能较为准确地预测出目的基因的转录因子结合位点,有效提高预测结果的真阳性率。

【技术实现步骤摘要】

本专利技术属于生物
,涉及一种预测转录因子与在靶基因上的结合位点的方法。
技术介绍
基因转录有正调控和负调控之分。如细菌基因的负调控机制是当一种阻遏蛋白 (repressor protein)结合在受调控的基因上时,基因不表达;而从靶基因上去除阻遏蛋白后,RNA(核糖核酸)聚合酶识别受调控基因的启动子,使基因得以表达,这是正调控,这种阻遏蛋白是反式作用因子。转录因子(transcription factor, TF)便是一种起正调控作用的反式作用因子,它是基因转录起始过程中RNA聚合酶所需的辅助因子。真核生物基因在无转录因子时处于不表达状态,RNA聚合酶自身无法启动基因转录,只有当转录因子(蛋白质)结合在其识别的DNA(脱氧核糖核酸)序列上后,基因才开始表达。转录因子与其靶基因序列的结合是依据靶基因序列上特定顺序序列的识别来完成的,这些特定的序列便是转录因子的结合位点(transcription factor binding site, TFBS),它们与转录因子相结合,调节着基因的转录过程。确定转录因子结合位点是理解转录调控机制、建立转录调控网络的关键问题。一个转录因子往往同时调控若干个基因,而它在不同基因上的结合位点具有一定的保守性,又不完全相同。较短的DNA片段在规模较大基因组中重复出现的次数很多,另外转录因子结合位点又允许一定的可变性,这给识别结合位点序列的研究工作带来了困难,使得预测转录因子结合位点的算法普遍存在假阳性率偏高的问题。近年来,随着大规模DNA测序成果的积累和生物芯片等高通量生物技术的发展, 人们对TFBS的研究也不断地深入一方面,生物实验验证的TFBS不断积累,转录调控网络数据不断丰富,另一方面,描述IFBS的模型不断增多,这些新模型以增加模型复杂度为代价,更多地保留了 TFBS数据中的信息,最后,得益于多基因组测序、大规模的新一代染色质免疫共沉淀芯片(ChlP-seq)实验、以及染色体结构(Chromatin structure)等研究,通过对多方面信息进行整合,预测TFBS的算法效率也有所提高。本专利技术专利针对于转录因子结合位点预测的研究,设计了一种预测方法,以提高转录因子结合位点预测的准确度。
技术实现思路
本专利技术专利设计了,该方法的基本实施流程如下步骤1、研究对象的基因组定位步骤2、基因启动子序列的提取步骤3、预测转录因子结合位点步骤4、统计分析预测结果通过以上方法,能较为准确地预测出目的基因的转录因子结合位点,保证了预测结果的真阳性率。附图说明图1、本专利技术专利所述方法的实施流程图具体实施例方式本专利技术将以Ephx2基因的转录因子结合位点预测为例,介绍本专利技术专利所述方法的具体实施步骤步骤1、基因组定位。以Ephx2为关键词,从NCBI的基因数据库(http://WWW. ncbi. nlm. nih. gov/gene/)检索基因信息,并下载基因序列数据到本地计算机。步骤2、提取启动子序列。分析步骤1中的基因信息,我们可以获得研究基因转录起始位点的位置信息。本实例中Ephx2的转录起始位点为chrl5 :45556101。利用序列编辑工具,我们提取转录起始位点上游4500bp,下游500bp之间的序列片段做为Ephx2的启动子序列。步骤3、预测转录因子结合位点。我们使用lister程序(http //ural. wustl. edu/ resources, html)预测Ephx2的转录因子结合位点,设置参数relative score > 0. 9。其中转录因子序列来源于数据库 TRANSFAC 7. 0 public (http //www. gene-regulation, com/ pub/databases, html),并将结果的假阳性率最小化。步骤4、统计步骤3中预测的本实例中目的基因Ephx2的转录因子结合位点预测结果,绘制转录因子结合位点图。以上是对本专利技术的描述而非限定,基于本专利技术思想的其它实施方式,均在本专利技术的保护范围之中。权利要求1.本专利技术专利所述的,该方法包括如下几步主要特征步骤1、研究对象的基因组定位步骤2、基因启动子序列的提取步骤3、预测转录因子结合位点步骤4、统计分析预测结果。全文摘要本专利技术设计了,该方法的基本实施流程如下步骤1、研究对象的基因组定位;步骤2、基因启动子序列的提取;步骤3、预测转录因子结合位点;步骤4、统计分析预测结果。通过该方法,能较为准确地预测出目的基因的转录因子结合位点,有效提高预测结果的真阳性率。文档编号G06F19/18GK102206699SQ201010227078公开日2011年10月5日 申请日期2010年7月14日 优先权日2010年7月14日专利技术者曾华宗 申请人:上海聚类生物科技有限公司本文档来自技高网
...

【技术保护点】
1.本专利技术专利所述的一种预测转录因子结合位点的方法,该方法包括如下几步主要特征:步骤1、研究对象的基因组定位步骤2、基因启动子序列的提取步骤3、预测转录因子结合位点步骤4、统计分析预测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:曾华宗
申请(专利权)人:上海聚类生物科技有限公司
类型:发明
国别省市:31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1