当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于多组学数据整合的植物全基因组多层次生物网络重建方法技术

技术编号:17597447 阅读:60 留言:0更新日期:2018-03-31 10:30
本发明专利技术公开了一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,该方法通过整合水稻基因调控网络、蛋白质互作网络和代谢网络,完成了水稻多层次调控网络的构建,同时通过整合水稻不同组织生长过程中的表达谱数据,根据建好的水稻多层次调控网络,进行特定组织多层次基因调控网络的构建,从而构建出第一个目前数据水平上最为完整的高质量的水稻基因组尺度的多层次生物网络,为植物多层次生物网络的构建提供一种新的思路,构建的水稻多层次基因调控网络数据库实现了多层次调控网络的3D可视化。

A multi hierarchy biological network reconstruction method for plant whole genome based on multicomponent data integration

The invention discloses a multi omics data integration in the plant genome multi-level biological network reconstruction method based on this method, through the integration of the rice protein interaction network, gene regulatory networks and metabolic networks, constructs the complete rice multi-level regulatory network, while the expression of different tissue growth process integration in rice spectrum data according to the established rice multi-level regulatory network, construct a multi-level organization specific gene regulatory network, in order to build the first level data at present the most complete high quality rice genome scale multi-level biological network, which provides a new idea for the construction of biological network plant multi-level, multi-level gene in rice the regulation network database to achieve the 3D visualization of multi-level regulatory network.

【技术实现步骤摘要】
一种基于多组学数据整合的植物全基因组多层次生物网络重建方法
本专利技术属于生物网络构建
,具体涉及一种基于多组学数据整合的植物全基因组多层次生物网络重建方法。
技术介绍
分子生物学研究表明基因型到表型发生的过程涉及到细胞内多种组分间的多层次的时空调控以及代谢产物在不同细胞器或组织中的分布,这些调控过程基本上呈现一个逐步细化的级联层次方式:基因组到转录组、转录组到蛋白质组、蛋白质组到代谢组、代谢组到表型,而中间各个过程又相互关联、密不可分。生物体在不同的生物过程中都对应着多层次网络的动态调控,包括基因调控网络(GRNs)、蛋白质互作网络(PPIs)和代谢网络(GSMN)等。目前已有上千个公共生物学数据库汇集了海量的基因组学、蛋白质组学和代谢组学的数据,使得预测基因、蛋白质间的调控关系和重建代谢途径变得可能。然而,生物过程背后的分子网络是个极其复杂的系统,其相应的属性和规律目前仍然是个需要深入研究的领域。我们必须在获得生物网络结构的基础上研究其动态属性,然后才能系统地分析其功能并预测未知的功能基因、蛋白和反应。所以最重要的一步就是如何有效挖掘和整合现有的分子生物学数据,构建组学尺度的生物网络,包括基因调控网络、蛋白质互作网络、代谢网络以及通过网络间的整合构建多层次的调控网络。随着测序技术的不断发展,物种全基因组测序工作的相继完成引领基因组尺度代谢网络的构建研究进入了一个崭新的时代。基因组尺度代谢网络的构建是从基因组序列出发,通过构建基因-蛋白质-反应的相互作用关系,结合计算机模型和实验数据,从系统的角度分析复杂的生物系统,定量研究生命体的代谢过程的一个必不可少的工具,它对于生命活动的理论研究和物种改良都具有重要的理论和实践意义。植物基因组尺度代谢网络模型,是在网络水平上研究植物代谢和指导植物代谢工程必不可少的工具。然而,由于植物自身的复杂性和基因组注释信息的不完整,植物代谢网络构建方面的研究仍面临着重大的挑战。目前,仅有拟南芥和玉米的基因组尺度的代谢网络模型被初步构建,其中deOliveiraDal'Molin等人通过构建拟南芥代谢网络模型(AraGEM,aGenome-ScaleReconstructionofthePrimaryMetabolicNetworkinArabidopsis.PlantPhysiology152(2):579-589.2010),鉴定了呼吸循环所需的最少反应,强调了光合代谢和非光合代谢的显著差异;Poolman等人利用拟南芥代谢网络揭示了维持和生产拟南芥细胞中生物组分所需的最少ATP(三磷酸腺苷)量(AGenome-ScaleMetabolicModelofArabidopsisandSomeofItsProperties.PlantPhysiol151(3):1570-1581.2009)。另外Grafahrend-Belau等人和Dal'Molin等人构建了特定生理条件和特定组织类型的植物代谢网络,前者构建了大麦种子的代谢网络,对不同生理条件下谷物产量和流分布进行了模拟预测;后者构建了C4GEM模型,主要针对C4植物,研究了C4光合作用过程中叶肉和维管束鞘细胞的代谢流的分布。目前,植物代谢网络的研究还只要停留在模型构建和特定条件或组织下代谢流的分析,如何利用植物代谢网络模型来指导植物代谢工程和品种改良,仍是一个需要研究人员攻克的重要难题。然而,水稻作为全世界最重要的粮食作物之一和禾本科植物的模式生物,其网络水平上的全基因组尺度代谢网络研究还处于空白阶段。近年来,一些科研团队在水稻一维组学模型构建方面取得了快速的进展。首先,LeeI等人基于24种不同类型的实验数据,高质量的完成了水稻基因组尺度上的蛋白编码基因调控网络的构建(Geneticdissectionofthebioticstressresponseusingagenome-scalegenenetworkforrice.ProcNatlAcadSciUSA45:18548-18553.2011);其次,MengY等人完成了水稻基因组尺度MicroRNA介导的基因调控网络的预测与构建(ConstructionofmicroRNA-andmicroRNA*-mediatedregulatorynetworksinplants.RNABiology8:6,1124-1148.2011),并通过了蛋白质降解组测序数据的验证;此外,GuH等人构建完成第一个水稻蛋白质互作数据库PRIN(PRIN:apredictedriceinteractomenetwork.BMCBioinformatics12:161.2011),通过数学预测的方法成功的扩展了现有的水稻蛋白质间的互作网络,完成了水稻组学尺度蛋白质间互作网络的构建。水稻多层次基因调控网络的构建,即通过对水稻不同一维组学尺度网络模型的整合包括基因调控网络,蛋白质互作网络和代谢网络等,完成水稻多维组学尺度网络模型的构建涉及基因组学,蛋白质组学和代谢组学。目前,水稻基因组尺度代谢网络模型的构建仍处于空白阶段,但水稻组学尺度基因调控网络模型,小分子核糖核酸介导的基因调控网络模型和蛋白质间相互作用网络模型的构建已相继完成。虽然当前不同组学间网络模型的整合研究尚未深入,但其一维组学尺度网络模型构建的相继完成为水稻多维组学尺度网络模型的构建带来了新的机遇。
技术实现思路
鉴于上述,本专利技术提出了一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,通过对现有生物学公共数据库信息的整合,以及运用生物信息学的方法对水稻基因组尺度的代谢网络进行初步构建,进而通过实验手段和文本挖掘的方法对网络进行精细的修正和评估,拟构建出了一个目前数据水平上最为完整的高质量的水稻基因组尺度的代谢网络。一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,包括如下步骤:(1)收集整合植物多组学数据;(2)基于所述植物多组学数据通过整合和修正构建水稻基因组尺度上的代谢网络模型;(3)基于所述代谢网络模型通过整合构建水稻多层次基因调控网络;(4)基于所述调控网络开发出水稻多层次基因调控网络数据库RiceNetDB以及该调控网络的3D可视化平台。进一步地,所述步骤(1)的具体实现为:首先,从各生物公共数据库(Tigr、KEGG、RiceCyc、Uniprot、Brenda等)中挖掘水稻全基因组注释信息和水稻反应及代谢的相关信息,并将数据库间的信息进行整合,去除数据库中错误和冗余的信息;然后,从基因调控网络数据库(如RiceNET)中提取水稻基因调控信息,从蛋白互作数据库(如BIND、PlaPid、PRIN等)中提取水稻蛋白互作信息,用于水稻多层次网络的整合和构建;从NCBI(NationalCenterforBiotechnologyInformation,美国国立生物技术信息中心)数据库中挖掘水稻各组织在生长过程中的基因表达谱数据,用于水稻生长过程基因调控网络的构建。进一步地,所述步骤(2)的具体实现为:首先,基于水稻全基因组注释信息鉴定水稻基因组尺度上与代谢相关的基因,并整合水稻反应及代谢的相关信息,建立关于基因-酶-反应的相互关系列表,完成水稻代谢网络模型的初步构建;然后,利用实验手段和本文档来自技高网
...
一种基于多组学数据整合的植物全基因组多层次生物网络重建方法

【技术保护点】
一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,包括如下步骤:(1)收集整合植物多组学数据;(2)基于所述植物多组学数据通过整合和修正构建水稻基因组尺度上的代谢网络模型;(3)基于所述代谢网络模型通过整合构建水稻多层次基因调控网络;(4)基于所述调控网络开发出水稻多层次基因调控网络数据库RiceNetDB以及该调控网络的3D可视化平台。

【技术特征摘要】
1.一种基于多组学数据整合的植物全基因组多层次生物网络重建方法,包括如下步骤:(1)收集整合植物多组学数据;(2)基于所述植物多组学数据通过整合和修正构建水稻基因组尺度上的代谢网络模型;(3)基于所述代谢网络模型通过整合构建水稻多层次基因调控网络;(4)基于所述调控网络开发出水稻多层次基因调控网络数据库RiceNetDB以及该调控网络的3D可视化平台。2.根据权利要求1所述的植物全基因组多层次生物网络重建方法,其特征在于:所述步骤(1)的具体实现为:首先,从各生物公共数据库中挖掘水稻全基因组注释信息和水稻反应及代谢的相关信息,并将数据库间的信息进行整合,去除数据库中错误和冗余的信息;然后,从基因调控网络数据库中提取水稻基因调控信息,从蛋白互作数据库中提取水稻蛋白互作信息,用于水稻多层次网络的整合和构建;从NCBI数据库中挖掘水稻各组织在生长过程中的基因表达谱数据,用于水稻生长过程基因调控网络的构建。3.根据权利要求1所述的植物全基因组多层次生物网络重建方法,其特征在于:所述步骤(2)的具体实现为:首先,基于水稻全基因组注释信息鉴定水稻基因组尺度上与代谢相关的基因,并整合水稻反应及代谢的相关信息,建立关于基因-酶-反应的相互关系列表,完成水稻代谢网络模型的初步构建;然后,利用实验手段和文本挖掘对初建的...

【专利技术属性】
技术研发人员:陈铭刘丽丽梅茜张子钧俞振泞孙天昊薛继统张霈婧胡大辉
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1