一种计算寡核苷酸基因芯片的UniGene表达量的算法制造技术

技术编号：5947355 阅读：338 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种计算寡核苷酸基因芯片的ＵｎｉＧｅｎｅ表达量的算法，属于生物技术领域，涉及基因芯片方面。本发明专利技术主要包括如下流程：步骤１，获得探针水平的表达值数据；步骤２，将探针集归入不同的ＵｎｉＧｅｎｅ；步骤３，以ＵｎｉＧｅｎｅ为单位，合并同一个ＵｎｉＧｅｎｅ下的探针集；步骤４，分别对每个ＵｎｉＧｅｎｅ下的所有探针进行层次聚类分析；步骤５，寻找层次聚类结果中的最大探针子集，作为该ＵｎｉＧｅｎｅ的代表探针集；步骤６，将代表探针集转化为ＵｎｉＧｅｎｅ水平的最终表达值。本发明专利技术的优点在于：该方法将多个探针集合并为一个ＵｎｉＧｅｎｅ来报告最终的表达值，综合了多个探针集的信息，相比于常规方法中单独使用一个探针集，结果更为可靠。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于生物
，涉及基因芯片方面。技术背景Affymetrix公司(Santa Clara, USA)是高密度寡核苷酸基因芯片全球最大的提供商。该公司在制造微阵列的生产过程中结合了化学和半导体技术，使Affymetrix在单个阵列1.25/5.25cm2的硅片上原位合成上百万种寡核苷酸探针。基因芯片与荧光标记的RNA样本杂交后，使用芯片扫描仪可以读取杂交信号。随后使用GeneChip Operating software (GCOS) 等软件可以做探针水平的背景扣除和归一化处理。然后使用相应的概要算法，即求每个探针集内所有探针的某种平均值，作为最终探针集的表达值。常用的概要算法有RMA ( Bolstad， BM. (2004) Low Level Analysis of High-density oligonucleotide array data: Background, normalization and summarization . Department of Statistics, University of California at Berkeley) ， GCRMA (Wu， Z. et.al. (2004) A model-based background adjustment for oligonucleotide expression arrays.丄Am. Stef. Assoc.， 99， 909-917) ， PLIER (Affymetrix, Inc. (2005) Technical no...

【技术保护点】
一种计算寡核苷酸基因芯片的ＵｎｉＧｅｎｅ表达量的算法，其特征在于该方法包括有如下步骤：　　　　步骤１，获得探针水平的表达值数据；　　　　步骤２，将探针集归入不同的ＵｎｉＧｅｎｅ；　　　　步骤３，以ＵｎｉＧｅｎｅ为单位，合并同一个ＵｎｉＧｅｎｅ下的探针集；　　　　步骤４，分别对每个ＵｎｉＧｅｎｅ下的所有探针进行层次聚类分析；　　　　步骤５，寻找层次聚类结果中的最大探针子集，作为该ＵｎｉＧｅｎｅ的代表探针集；　　　　步骤６，将代表探针集转化为一个表达值，即为ＵｎｉＧｅｎｅ水平的最终表达值。

【技术特征摘要】

【专利技术属性】
技术研发人员：曾华宗，刘极龙，
申请(专利权)人：上海敏芯信息科技有限公司，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人