基因芯片差别基因识别方法技术

技术编号:12843032 阅读:122 留言:0更新日期:2016-02-11 11:17
本发明专利技术属于在分子生物学技术领域,一种基因芯片差别基因识别方法,其特征在于,包括:对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D;获取已知基因序列库L,以及各基因数据归一化表述DL;设定差异阈值T;将基因芯片中基因和基因库中基因进行比较,获取二者差异DIFF=D-DL;步骤4中,如果基因芯片中基因和基因库中所有基因的差异DIFF均大于阈值T,则定义为差别基因。本方法适用于小样本的基因芯片实验设计,克服了常规方法难以对小样本基因芯片进行差别基因片段的缺陷。

【技术实现步骤摘要】
【专利说明】
本专利技术属于分子生物学
以及信息
,本专利技术涉及一种,本方法适用于小样本的基因芯片实验设计。
技术介绍
基因芯片,是指将许多已知序列寡核苷酸或cDNA片段有规律地排列在基片上,将待测的样品与芯片互补配对原则进行杂交。通过荧光检测系统对芯片进行扫描,并配以计算机系统对每一探针上的荧光信号做出检测和比较,可以迅速得出实验结果。基因芯片可以对大量基因的表达水平进行快速、准确、高效地检测,且只需要少量样品。基因芯片技术有效且应用广泛。差别基因的识别是基因芯片分析及其重要的步骤。但是实际中,由于基因芯片价格昂贵,样本数量少,这类芯片数据目前的分析方法基本上是经验算法,其敏感性与特异性难以估计,有较大误差。本专利技术我们提出一种新算法,来对小样本基因芯片产生的差别基因进行筛选。
技术实现思路
本专利技术的目的在于公开一种,对小样本基因芯片差别基因进行筛选。为此,本专利技术给出的技术方案为: 步骤1,对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D ; 步骤2,获取已知基因序列库L,以及各基因数据归一化表述DL ; 步骤3,设定差异阈值T; 步骤4,将基因芯片中基因和基因库中基因进行比较,获取二者差异DIFF=D-DL ; 步骤5,步骤4中,如果基因芯片中基因和基因库中所有基因的差异DIFF均大于阈值T,则定义为差别基因。本方法适用于小样本的基因芯片实验设计,克服了常规方法难以对小样本基因芯片进行差别基因片段的缺陷。【具体实施方式】以下结合实施例对本专利技术技术方案做进一步说明。本实施例中采用的本领域的常规方法对芯片数据进行归一化处理,如使用芯片扫描图像处理软件(例如GenePix pro 4.0)获得基因水平的表达值数据。接着对芯片数据进行芯片间的归一化处理。实施例1 步骤1,对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D ; 本步骤主要用于提取芯片上的基因数据,并对其进行归一化处理,便于后续的对比。比如采用GenePix pro 4.0获得基因水平的表达值数据,接着对芯片数据进行芯片间的归一化处理。步骤2,犾取已知基因序列库L ; 这里的基因序列库的获取可以来自于各种公开的方式。另外,这里的基因序列库可以局限在本芯片需要确认的基因中;也可以选取本芯片目的基因所属分类的基因库。原则为能够尽可能的完成基因对比覆盖。并得到库中各基因的归一化数据DL。步骤3,设定差异阈值T ;此处的阈值采用设置统一阈值的方式,也可以考虑针对不同基因进行不同的阈值设置。进一步,还可以根据温度等进行调整,加入调整因子k。步骤4,将基因芯片中基因和基因库中基因进行比较;将从步骤1中获取的某芯片基因数据和基因库中各基因数据进行对比,得到其差异数据DIFF=D-DL。注意:这里的D是某个芯片基因数据,而DL是某个基因库数据。步骤5,如果此芯片基因数据和基因库中各基因的差异DIFF均大于各自阈值,则定义为差别基因。如果设置了不同的阈值和调整因子,则在进行比较时,需要根据不同的条件采用不同的阈值。一个芯片基因数据识别完成后,选取下一个芯片基因数据重复步骤4和5,直到整个芯片数据识别完成。【主权项】1.一种,其特征在于,其特征在于,包括如下步骤: 步骤1,对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D ; 步骤2,获取已知基因序列库L,以及各基因数据归一化表述DL ; 步骤3,设定差异阈值T; 步骤4,将基因芯片中基因和基因库中基因进行比较,获取二者差异DIFF=D-DL ; 步骤5,步骤4中,如果基因芯片中基因和基因库中所有基因的差异DIFF均大于阈值T,则定义为差别基因。【专利摘要】本专利技术属于在分子生物学
,一种,其特征在于,包括:对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D;获取已知基因序列库L,以及各基因数据归一化表述DL;设定差异阈值T;将基因芯片中基因和基因库中基因进行比较,获取二者差异DIFF=D-DL;步骤4中,如果基因芯片中基因和基因库中所有基因的差异DIFF均大于阈值T,则定义为差别基因。本方法适用于小样本的基因芯片实验设计,克服了常规方法难以对小样本基因芯片进行差别基因片段的缺陷。【IPC分类】C12Q1/68【公开号】CN105316400【申请号】CN201410376287【专利技术人】严冰冰, 易雪莲, 邹晓文, 孔祥生 【申请人】晶能生物技术(上海)有限公司【公开日】2016年2月10日【申请日】2014年8月3日本文档来自技高网
...

【技术保护点】
一种基因芯片差别基因识别方法,其特征在于,其特征在于,包括如下步骤:步骤1,对芯片基因数据进行归一化处理,得到各芯片基因数据归一化数据D;步骤2,获取已知基因序列库L,以及各基因数据归一化表述DL;步骤 3,设定差异阈值T;步骤 4,将基因芯片中基因和基因库中基因进行比较,获取二者差异DIFF=D‑DL;步骤 5,步骤4中,如果基因芯片中基因和基因库中所有基因的差异DIFF均大于阈值T,则定义为差别基因。

【技术特征摘要】

【专利技术属性】
技术研发人员:严冰冰易雪莲邹晓文孔祥生
申请(专利权)人:晶能生物技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1