The invention discloses a pairing interaction method and prediction of gene detection model, detection method comprises the following steps: for a given data set {Yi, Xij}, first for each gene expression values were normalized to obtain data matrix rank, {Yi, normalized Rij}, i.e. for any gene J, its expression value from small to large order, then each expression value of the arrangement position instead of the initial expression value; conversion using ABS mode on any of the two genes P and Q, to obtain the converted data set {Yi, Zis}; ABS: Zis = |Rip - Riq| mode; I = 1,2,... N; P = 1,2,... M; q = 1,2,... M, P = q; s = 1,2,... M, /2 (M 1); n is the number of samples in the dataset, the M dataset for the number of genes; calculation between each variable Zis and phenotype of Yi T, according to the T value to determine the interaction effect between the two gene. The invention can effectively improve the prediction accuracy of the model.
【技术实现步骤摘要】
一种配对互作基因检测方法及预测模型
本专利技术涉及基因芯片技术,特别是一种配对互作基因检测方法及预测模型。
技术介绍
基因芯片技术也称DNA微阵列(Microarray),是一种从转录组水平检测基因表达情况的高通量技术。基因芯片技术的出现,使得从大规模基因表达水平上探究复杂疾病机理成为可能。基因选择是芯片数据分析的重要任务,基因选择即从上万个表达基因中筛选出与肿瘤表型相关的信息基因。芯片技术能一次检测上万个基因的表达量,但并不是每个基因都与肿瘤表型相关,过多的无关、冗余基因可导致过拟合、维数灾等问题,且不利于肿瘤发病机制研究。通过基因选择剔除无关基因,选择一个相关子集至少有以下三个优点:1)提高分类(诊断)模型的泛化性;2)基于少量的基因实施高精度诊断,可以大幅度降低诊断成本,是实现临床应用的基础;3)选择与肿瘤表型相关的基因有利于进一步实现肿瘤机理解析。信息基因选择对临床诊断、药物靶点筛选以及疾病机理研究等意义重大。大量研究表明,基于多基因的功能通道变异而非单基因变异是导致复杂疾病的主要原因。传统单基因过滤方法(例如t测验[1])仅能筛选与疾病相关的单效应基因,无法检测到与疾病相关的互作基因。两两基因配对互作是基因互作的最基本形式,现今已有大量研究致力于筛选与复杂疾病关联的配对互作基因,图1-图4展示了典型的配对互作基因情形:单独基于基因A(geneA)无法有效区分得病样本与健康样本,单独基于基因B(geneB)同样无法有效区分得病样本与健康样本,当同时考虑geneA与geneB时可有效区分得病样本与健康样本。配对互作基因检测方法可分为两大类:第一类为基 ...
【技术保护点】
一种配对互作基因检测方法,其特征在于,包括以下步骤:1)对给定的数据集{Yi,Xij},首先对每个基因表达值进行秩规格化,得到规格化后的数据矩阵{Yi,Rij};2)对任意两个基因p和基因q采用abs模式进行转换,获得转换后的数据集{Yi,Zis};abs模式:Zis=|Rip–Riq|;其中i=1,2,…,n;p=1,2,…,m;q=1,2,…,m;p≠q;s=1,2,…,m(m‑1)/2;n为数据集中的样本数,m为数据集中的基因数;Rip表示第i个样本的第p个基因排秩转换后的表达值;Riq表示第i个样本的第q个基因排秩转换后的表达值;3)基于t测验方法计算每个变量Zis与表型Yi之间的t值,根据t值对应的概率值p值判断两个基因之间的互作效应。
【技术特征摘要】
1.一种配对互作基因检测方法,其特征在于,包括以下步骤:1)对给定的数据集{Yi,Xij},首先对每个基因表达值进行秩规格化,得到规格化后的数据矩阵{Yi,Rij};2)对任意两个基因p和基因q采用abs模式进行转换,获得转换后的数据集{Yi,Zis};abs模式:Zis=|Rip–Riq|;其中i=1,2,…,n;p=1,2,…,m;q=1,2,…,m;p≠q;s=1,2,…,m(m-1)/2;n为数据集中的样本数,m为数据集中的基因数;Rip表示第i个样本的第p个基因排秩转换后的表达值;Riq表示第i个样本的第q个基因排秩转换后的表达值;3)基于t测验方法计算每个变量Zis与表型Yi之间的t值,根据t值对应的概率值p值判断两个基因之间的互作效应。2.根据权利要求2所述的配对互作基因检测方法,其特征在于,对应p值小...
【专利技术属性】
技术研发人员:陈渊,袁哲明,杨晶晶,谭泗桥,邢鹏伟,
申请(专利权)人:湖南农业大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。