当前位置: 首页 > 专利查询>济南大学专利>正文

一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法技术

技术编号:21226516 阅读:54 留言:0更新日期:2019-05-29 07:18
本发明专利技术属于植物分子生物技术和基因工程领域,具体涉及一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法,该方法是通过以下步骤实现的:首先收集玉米自交系授粉后15天的籽粒转录本测序获得基因表达量数据;收集与玉米籽粒含油量相关联的基因数据;收集玉米自交系组成的关联群体的籽粒含油量数据;建立动态关联分析LA模型;LA显著性评估;在全基因组范围内挖掘调控油份关联基因与含油量的动态相关性的基因;对显著LA结果的基因进行功能注释,预测未知基因的功能。本发明专利技术以玉米籽粒中基因对共表达模式动态关联这一现象为突破口,预测未知基因功能。相比较于传统的共表达网络构建,动态关联分析可以快速找到调控共表达模式的调控基因。

A Method for Predicting the Function of Unknown Genes in Maize Based on the Dynamic Correlation between Oil Associated Genes and Oil Content

The invention belongs to the field of plant molecular biotechnology and genetic engineering, and specifically relates to a method for predicting the function of unknown genes in Maize Based on the dynamic correlation between oil-related genes and oil content. The method is realized through the following steps: firstly, gene expression data are obtained by sequencing of transcripts of maize inbred lines 15 days after pollination; secondly, data related to oil content of maize seeds are collected. Gene data associated with oil content in maize inbred populations were collected; LA model for dynamic correlation analysis was established; LA significance evaluation was conducted; genes regulating the dynamic correlation between oil content and oil content were mined throughout the genome; genes with significant LA results were functional annotated to predict the function of unknown genes. The invention takes the phenomenon that genes in maize grains are dynamically correlated with co-expression patterns as a breakthrough to predict the function of unknown genes. Compared with the traditional co-expression network construction, dynamic association analysis can quickly find regulatory genes regulating co-expression patterns.

【技术实现步骤摘要】
一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法
本专利技术属于植物分子生物技术和基因工程领域,具体涉及一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法。
技术介绍
玉米是世界三大主要农作物之一,20世纪90年代以来,世界玉米总产量首次超越水稻和小麦,成为第一位的粮食作物。玉米籽粒中累积了大量的储存物质包括淀粉、油份和蛋白。随着人们生活水平的提高和膳食结构的变化,以及淀粉和油脂加工业的发展,玉米品种由产量型逐渐向质量型转变,玉米品质及其专用性变得越来越重要。玉米油富含维生素E等多种微量元素,不饱和脂肪酸的含量达80%以上。长期食用玉米油可防治夜盲症、干眼病等多种疾病,并可降低人体血液中的胆固醇含量,预防粥样动脉硬化和冠状动脉硬化。因此玉米油享有―健康油的美誉。高油玉米是指籽粒含油量高于6%的玉米。玉米籽粒中85%左右的油份储存在胚中,所以高油玉米往往具有一个较大的胚面,同时高油玉米具有较高的蛋白质、赖氨酸、色氨酸含量。作为饲料,高油玉米可以显著提高牲畜的产肉率。除籽粒品质优良外,高油玉米的秸秆含有较高的粗蛋白、粗脂肪等营养物质,可作青饲或青贮,是草食动物的优良饲料。但是目前关于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法还鲜有报道。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法,该方法通过动态关联分析,鉴定玉米油份基因组基因共表达模式的动态关联,根据LA结果,预测未知基因对油份高低影响的功能。本专利技术是通过以下技术方案来实现的:本专利技术提供了一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法,包括以下步骤:(1)收集玉米自交系授粉后15天的籽粒转录本测序获得基因表达量数据;(2)收集26个与玉米籽粒含油量相关联的基因数据;(3)收集玉米自交系组成的关联群体的籽粒含油量数据;(4)动态关联分析LA模型的建立;(5)LA显著性评估;(6)在全基因组范围内挖掘调控油份关联基因与含油量的动态相关性的基因;(7)对显著LA结果的基因进行功能注释,预测未知基因的功能。进一步的,所述玉米自交系分成了2组:热带和亚热带、温带,小组内采用完全随机区组法,设2个重复,每个自交系每个重复播种1行,所有材料均进行自交,收获未成熟的授粉后15天的籽粒,每个自交系的两个重复各取3-4穗,每穗取1-2粒籽粒,混合提取籽粒总RNA,随机选择自交系数量的样品用于RNA-seq。上述RNA-seq包括以下步骤:首先,用Ploy(T)寡聚核苷酸从总RNA中抽取全部带Ploy(A)尾的RNA,主要为mRNA,然后将截获的mRNA随机打断成片段,用六碱基随机引物合成cDNA第一链,并加入逆转录酶合成cDNA第二链,经过试剂盒纯化并对cDNA片段进行末端修饰,连接测序接头,再经琼脂糖凝胶电泳回收目的大小片段,进行PCR扩增,用IlluminaGAⅡ基因分析系统进行序列测定及分析,获得基因的表达量数据。进一步的,所述动态关联分析LA模型具体采用以下方法建立:LA的数学定义如下:LA(X,Y|Z)=Eg'(z)公式1其中,所述X、Y和Z为玉米籽粒中基因表达量数据;假设X,Y,Z是均值为0,方差为1的连续随机变量,则X,Y的相关性表示为E(XY);当Z=z时,g(z)=E(XY|Z=z),g(z)检测的是当Z=z时,XY基因对的共表达模式。g(z)的导数表示为g'(z),该值可用于共表达模式变化的期望测定,当Z符合标准正态分布时,LA值可简单的表示为LA(X,Y|Z)=E(XYZ)。X,Y,Z代表具有正态分布表达谱的三个基因,则LA(X,Y|Z)表示为:E(XYZ)=(x1y1z1+x2y2z2+...+xmymzm)/m公式2LA用来反应基因对共表达模式的动态变化,即当Z基因表达量较高时,XY基因对的表达量呈正相关(co-regulated),E(XY|Z=1)为正数;当Z基因表达量较低时,XY基因对的表达量呈负相关(contra-regulated,),E(XY|Z=0)为负数,因此基因对的表达调控模式由正相关(co-regulated)转变为负相关(contra-regulated),LA值记为正;相反,基因对的表达调控模式由负相关(contra-regulated)转变为正相关(co-regulated),LA值记为负。本专利技术所建立的动态关联分析模型的评估步骤如下:混合所有基因的表达量值;在每次模拟中,用放回随机抽样法随机抽取一对基因(X,Y)的表达量值,Z基因取全基因组所有基因,计算XY基因对在全基因组的LA值,可分别得到LA的正极大值和负极小值;重复模拟一百万次,分别得到LA的正值参考分布和负值参考分布,用LA正负参考分布的99%分位数作为LA正负显著性阈值。进一步的,所述全基因组动态关联分析的结果按照LA值的大小进行过滤,对显著LA的基因进行功能注释,预测未知基因功能。研究表明功能相近基因表达模式不相关的原因主要包含以下两个假设,一是这些功能相近基因的表达调控不在mRNA水平上,二是功能相近基因的表达模式只在特定的细胞环境中才相关,即共表达模式的动态关联,动态关联分析(liquidassociation,LA)为验证第二种假设提供了理论支持。本专利技术基于功能相近基因,表达模式相关的科学假设,采用LA方法鉴定玉米全基因组基因共表达模式的动态关联,根据显著LA结果中基因的功能注释,预测未知基因功能,并根据未知基因在拟南芥中的同源基因功能,验证LA预测结果,思路创新,在植物学领域该项研究尚无报道。本专利技术的有益效果为:(1)本专利技术以玉米籽粒中油份基因对共表达模式动态关联这一现象为突破口,预测未知基因功能。相比较于传统的共表达网络构建,动态关联分析可以快速找到调控共表达模式的调控基因;(2)本专利技术通过对显著LA结果的基因进行功能注释,推测未知基因功能,并通过同源基因的功能验证预测结果,是预测未知基因功能的有效方法。附图说明图1为本专利技术分析机制的流程图图2为随机模拟生成LA值评估LA分析的显著性。图3为本专利技术实施例1AC196475.3_FG005基因的LA分析。图4为本专利技术实施例1AC196475.3_FG005基因的区段关联分析。具体实施方式下面结合附图和具体实施例对本专利技术作进一步说明,下述说明仅是实例性的,不限定本专利技术的保护范围。实施例1一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法,主要包括三步,油份基因表达量数据的收集、LA显著性评估和全基因组LA分析。(1)基因表达量数据的收集:368份自交系于2010年在湖北荆州种植,根据系谱信息分成了2组(热带和亚热带、温带),小组内采用完全随机区组法,设2个重复,每个自交系每个重复播种1行。所有材料均进行自交,收获未成熟的授粉后15天(15DAP)的籽粒,每个自交系的两个重复各取3-4穗,每穗取1-2粒籽粒,混合提取籽粒总RNA,随机选择368个样品用于RNA-seq。样品的RNA-Seq工作是由深圳华大基因研究院(BeijingGenomicsInstitute,BGI)完成,测序方法简要描述如下:首先,用Ploy(T)寡聚核苷酸从总RNA中抽取全部带本文档来自技高网...

【技术保护点】
1.一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法,其特征在于,包括以下步骤:(1)收集玉米自交系授粉后15天的籽粒转录本测序获得基因表达量数据;(2)收集26个与玉米籽粒含油量相关联的基因数据;(3)收集玉米自交系组成的关联群体的籽粒含油量数据;(4)动态关联分析LA模型的建立;(5)LA显著性评估;(6)在全基因组范围内挖掘调控油份关联基因与含油量的动态相关性的基因;(7)对显著LA结果的基因进行功能注释,预测未知基因的功能。

【技术特征摘要】
1.一种基于油份关联基因与含油量动态相关性预测玉米未知基因功能的方法,其特征在于,包括以下步骤:(1)收集玉米自交系授粉后15天的籽粒转录本测序获得基因表达量数据;(2)收集26个与玉米籽粒含油量相关联的基因数据;(3)收集玉米自交系组成的关联群体的籽粒含油量数据;(4)动态关联分析LA模型的建立;(5)LA显著性评估;(6)在全基因组范围内挖掘调控油份关联基因与含油量的动态相关性的基因;(7)对显著LA结果的基因进行功能注释,预测未知基因的功能。2.根据权利要求1所述的方法,其特征在于,所述玉米自交系分成了2组:热带和亚热带、温带,小组内采用完全随机区组法,设2个重复,每个自交系每个重复播种1行,所有材料均进行自交,收获未成熟的授粉后15天的籽粒,每个自交系的两个重复各取3-4穗,每穗取1-2粒籽粒,混合提取籽粒总RNA,随机选择自交系数量的样品用于RNA-seq。3.根据权利要求2所述的方法,其特征在于,所述RNA-seq包括以下步骤:首先,用Ploy(T)寡聚核苷酸从总RNA中抽取全部带Ploy(A)尾的RNA,主要为mRNA,然后将截获的mRNA随机打断成片段,用六碱基随机引物合成cDNA第一链,并加入逆转录酶合成cDNA第二链,经过试剂盒纯化并对cDNA片段进行末端修饰,连接测序接头,再经琼脂糖凝胶电泳回收目的大小片段,进行PCR扩增,用IlluminaGAⅡ基因分析系统进行序列测定及分析,获得基因的表达量数据。4.根据权利要求1所述的方法,其特征在于,所述动态关联分析LA模型具体采用以下方法建立:LA的数学定义如下:LA(X,Y|Z)=Eg'(z)公式1其中,所述X、Y和Z为玉米籽粒中基因表达量数据;假设X,Y,Z是均值为0,方差为1的连续...

【专利技术属性】
技术研发人员:李慧高幸幸车荣会李为珺
申请(专利权)人:济南大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1