【技术实现步骤摘要】
一种高通量转录组测序数据与性状关联分析系统及方法
本专利技术涉及生物信息
,具体而言,涉及一种高通量转录组测序数据与性状关联分析系统及方法。
技术介绍
转录组广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合。蛋白质是行使细胞功能的主要承担者,蛋白质组是细胞功能和状态的最直接描述,转录组成为研究基因表达的主要手段,转录组是连接基因组遗传信息与生物功能的蛋白质组的必然纽带,转录水平的调控是目前研究最多的,也是生物体最重要的调控方式。而高通量测序技术又称“下一代”测序技术,以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。挖掘重要性状的候选基因是动植物遗传育种领域的一项主要研究内容,它对于分子辅助育种,包括基因组选择和基因编辑都具有重要意义。目前,高通量转录组测序已成为遗传育种领域挖掘重要性状候选基因所使用的主流方法之一。对于数量性状,现有技术未充分利用个体的表型信息,其将连续变化的数据类型简单地按照 ...
【技术保护点】
1.一种高通量转录组测序数据与性状关联分析系统,其特征在于,包括:/n数据获取模块,用于获取对象的高通量转录组测序数据以及性状表型值;/n表达量获取模块,用于根据所述高通量转录组测序数据获取所述对象的每个基因的归一化表达量;/n拟合模块,用于通过线性回归模型拟合所述对象的性状表型值与每个所述基因的归一化表达量之间的关系;/n求解分析模块,用于求解所述线性回归模型并将所有效应不为零的基因作为与性状关联的基因。/n
【技术特征摘要】
1.一种高通量转录组测序数据与性状关联分析系统,其特征在于,包括:
数据获取模块,用于获取对象的高通量转录组测序数据以及性状表型值;
表达量获取模块,用于根据所述高通量转录组测序数据获取所述对象的每个基因的归一化表达量;
拟合模块,用于通过线性回归模型拟合所述对象的性状表型值与每个所述基因的归一化表达量之间的关系;
求解分析模块,用于求解所述线性回归模型并将所有效应不为零的基因作为与性状关联的基因。
2.如权利要求1所述的一种高通量转录组测序数据与性状关联分析系统,其特征在于,所述线性回归模型的表达式为其中,y为性状表型值向量,μ1为群体均值,Xi是第i个基因的表达量,bi为第i个基因表达量对所述性状表型值的偏回归系数,m为基因数,e为残差。
3.如权利要求2所述的一种高通量转录组测序数据与性状关联分析系统,其特征在于,所述求解分析模块包括算法单元,所述算法单元用于根据弹性网络算法求解所述线性回归模型。
4.如权利要求3所述的一种高通量转录组测序数据与性状关联分析系统,其特征在于,所述弹性网络算法的最小目标函数为其中,λ和α均为调整参数。
5.一种高通量转录组测序数据与性状关联分析方法,其特征在于,包括如下步骤:
获取对象的高通量转录组测序数据以及性状表型值;
根据所述高通量转录组测序数据获取所述对象的每个基因的归一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。