【技术实现步骤摘要】
一种新的分析生物基因组拷贝数变异的可视化方法
本专利技术属于生物信息学或基因技术的
,涉及一种提供生物基因可视化的方法。
技术介绍
随着生物科学的发展,人类基因组计划完成后,人类对生命现象的探索越来越深入。我们已经知道人体基因约含3万多个基因,它们由约30亿个碱基对组成,分布在细胞核的23对染色体中。DNA序列总量实在是一个天文数字,然而研究DNA及其编码的功能大分子蛋白质,对逐日增多的序列和结构进行收集、整理、储存、发布、提取和加工。并从中分析和发现新的序列,从而不断揭示人体生理和病理过程的分子基础,为人类疾病的预防、诊断和治疗提供依据,其意义是十分重大的,并已形成了“生物信息学”一门新兴学科。全基因组拷贝数变异的可视化研究,也是一个重要的内容。目前全基因组拷贝数变异可视化的方法比较单一,其特点是直观方便,但是在多个癌症类型下进行拷贝数变异对比,或者在同一个癌症类型下不同类型样本的拷贝数变异的对比的效果不是很好。
技术实现思路
为了解决现有技术中存在的问题,本专利技术提供一种新的分析生物基因组拷贝数变异的可视化方法(Mountainplot),克服现有技术中多 ...
【技术保护点】
一种新的分析生物基因组拷贝数变异的可视化方法,其特征在于,包括以下步骤:(1)横纵坐标的确定:人体有22条常染色体,基因约含3万多个基因,每个基因都有具体对应的几号染色体和对应的具体的起始位置,把每个染色体的所有基因,按照每个基因的起始位置作为横坐标,用matlab软件中的均值函数或者中位数函数遍历该基因对应的所有样本拷贝数,将该基因的均值或者中位数值作为纵坐标;(2)绘图:用matlab中的plot函数,绘制点;由于每条染色体上的基因个数很多,所有绘制出的结果是点很密;(3)生物中每条染色体的着丝粒都有具体的位置坐标,用matlab中的line函数,用黑色的竖杠将着丝粒表 ...
【技术特征摘要】
1.一种新的分析生物基因组拷贝数变异的可视化方法,其特征在于,包括以下步骤:(1)横纵坐标的确定:人体有22条常染色体,基因约含3万多个基因,每个基因都有具体对应的几号染色体和对应的具体的起始位置,把每个染色体的所有基因,按照每个基因的起始位置作为横坐标,用matlab软件中的均值函数或者中位数函数遍历该基因对应的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。