【技术实现步骤摘要】
生物标记提取装置及其方法
本专利技术涉及一种生物信息学(Bioinformatics)技术,尤其涉及一种基于在序列上出现的变异对基因功能导致的危害性的分析,提取可靠性更高的生物标记的装置及其方法。
技术介绍
人类基因项目完成后,开始解读人类DNA碱基序列,并开始揭开人类基因的多样的功能。尤其,发现了多样的基因变异,从而揭开了其不仅导致人类性状的差异,而且有可能成为特定疾病的原因,对人类基因的分析研究也进一步加速。然而,要揭开在人类基因中有可能产生的庞大的遗传性变异中哪些变异实际上成为病因,还存在困难。最近,作为解决这种问题的对策,正在研究下一代基因测序技术(NextGenerationSequencing)。通过该技术可以对个别人类的整个基因进行碱基序列化,并且通过疾病群与正常群的碱基序列及变异比较分析方法,可以提取疾病特异性的基因变异。另一方面,与其相反,还在研究不是碱基序列测序,而是通过单核苷酸多态性(singlenucleotidepolymorphism)芯片,依据种群(population)统计分析进行的全基因组关联研究(GenomeWideAssociationStudy)分析技术。根据该技术,通过自数千至数万名中取得的单核苷酸多态性(SNP)数据分析,可以提取在特定疾病群中频繁发生的显著的遗传性变异。然而,即使通过多样的分析技术提取遗传性变异,但要确认包括这种遗传性变异的基因的实际表达以及功能上障碍与否,还需要进一步实验,这在时间以及费用方面造成相当的损失。尤其,仅仅通过个别基因变异信息,不能对引发特定疾病的多样的病因提供足够的说明。为了克服 ...
【技术保护点】
【技术特征摘要】
2010.10.27 KR 10-2010-01055041.一种生物标记提取装置,所述装置分析在序列上出现的变异对基因功能导致的变化,提取成为特定疾病的原因的生物标记,其特征在于,包括:一预处理部,分析基因试样的序列,提取在基因上定位的变异数据;一危害性预测器,定量由于所述变异数据在所述基因功能上发生的障碍,而求出危害性分数;一模块化部,在基因网络,探索所述危害性分数在预定临界值以上的基因集合的子模块,所述危害性预测器还包括:重要性计算部,基于所述变异数据的频率计算相应基因变异的重要性,所述重要性计算部,在获得相应基因变异在疾病群试样中发现的0至1之间的概率之后,通过0和1处的坡度小于0.5处的坡度的定位函数对所述概率进行修正,由此获得所述重要性,所述危害性分数是反映所述重要性而求出。2.根据权利要求1所述的生物标记提取装置,其特征在于,所述预处理部包括:一疾病群比较部,互相比较疾病群变异与正常群变异,在所述分析的基因试样中获取所述疾病群中存在的变异;一变异提取部,参照公知的变异数据库,在所述获取的疾病群变异中提取新变异;一变异定位部,在功能性基因上定位所述提取的新变异。3.根据权利要求2所述的生物标记提取装置,其特征在于,所述变异定位部,在所述提取的新变异中,只提取在表达为蛋白质时氨基酸改变的种类,并在所述功能性基因上进行定位。4.根据权利要求1所述的生物标记提取装置,其特征在于,所述危害性预测器包括危害性计算部,所述危害性计算部在多个危害性预测模型上适用所述变异数据而获得各个危害性后,在所述各个危害性上适用权重值而计算权重危害性。5.根据权利要求4所述的生物标记提取装置,其特征在于,所述危害性计算部包括:一特征向量产生部,其从所述变异数据产生包含多样的要素的特征向量;一适配器,在所述产生的特征向量中选出各个预测模型所需要素;两个以上的预测模型,输入所述选出的要素,就能够在蛋白质序列内发现个别的非同义单核苷酸多态性;一权重值适用部,在所述预测模型的输出上适用权重值进行合计。6.根据权利要求5所述的生物标记提取装置,其特征在于,所述权重值适用部,将所述预测模型的输出正规化为0至1之间的值后,适用所述权重值进行合计,并将所述合计的结果正规化为0至1之间的值。7.根据权利要求5所述的生物标记提取装置,其特征在于,所述特征向量,在定位基因变异的基因及蛋白质的相应位置上氨基酸的各种生物种间的保守性分数、氨基酸取代导致的生物化学性质的变化、蛋白质结构特征的变化、有无内含子切接点位置、5端非翻译区变异位置中,包括两个以上。8.根据权利要求5所述的生物标记提取装置,其特征在于,所述预测模型,在SIFT、PolyPhen、MAPP中,至少包括一个。9.根据权利要求4所述的生物标记提取装置,其特征在于,所述危害性预测器还包括:一分数计算部,组合所述权重危害性及所述重要性,而计算危害性分数。10.根据权利要求9所述的生物标记提取装置,其特征在于,所述分数计算部,在一个基因内基因变异所具有的危害性分数的和,除以所述基因的长度,而求出最终危害性分数。11.根据权利要求1所述的生物标记提取装置,其特征在于,所述模块化部,基于现在的基因节点的集合上合并邻接基因是否显著,而重复进行更新基因网络的过程,而探索所述子模块。12.根据权利要求11所述的生物标记提取装置,其特征在于,所述模块化部,利用在所述危害性分数超过预定临界值的基因数量的超几何分布中获得的概率,判断所述显著性。13.根据权利要求12所述的生物标记提取装置,其特征在于,所述预定临界值以整个基因的危害性分数分布中预定百分位数为准而决定。14.根据权利要求1所述的生物标记提取装置,其特征在于,还包括网络合并部,在公知的蛋白质相互作用数据库中合并从求出所述危害性分数的基因表达...
【专利技术属性】
技术研发人员:尹泓皙,宣忠贤,朴仁镐,
申请(专利权)人:三星SDS株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。