当前位置: 首页 > 专利查询>艾云灿专利>正文

一种基因组序列的指纹图谱的景观分析方法及用途技术

技术编号:15691304 阅读:76 留言:0更新日期:2017-06-24 04:24
本发明专利技术属于生物信息学技术领域,涉及一种基因组序列的指纹图谱的景观分析方法及用途。本发明专利技术的方法是组合构造2种基因组序列的指纹图谱:1个基因组序列的指纹图谱(a map of genome fingerprints)和1组(含2个及2个以上的)基因组序列的指纹图谱云图(a galaxy of genome fingerprints maps)。由此全局集中展示批量基因组序列的指纹图谱,比较分析指纹图谱的综合景观的差异。本发明专利技术方法的用途包括3个方面:辨识基因组序列的不同组装版本的差异,校验基因组序列的组装质量,检测基因组序列中的重复序列。

Landscape analysis method of fingerprint sequence of genome sequence and use thereof

The invention belongs to the technical field of bioinformatics, and relates to a landscape analysis method of a fingerprint sequence of a genomic sequence and the use thereof. The method of the invention is a combination of 2 kinds of structure of fingerprint: fingerprint of genomic sequences of 1 genomic sequences (a map of genome fingerprints) and group 1 (including 2 and 2 above) fingerprint cloud genome sequence (a galaxy of genome fingerprints maps). Thus, the fingerprints of mass genome sequences are comprehensively displayed, and the differences of synthetic landscapes of fingerprints are compared and analyzed. The use of the present method includes 3 aspects: identifying differences in different assembly versions of genome sequences, verifying assembly quality of genome sequences, and detecting repetitive sequences in genome sequences.

【技术实现步骤摘要】
一种基因组序列的指纹图谱的景观分析方法及用途
本专利技术属于生物信息学
,更确切的是涉及一种基因组序列的指纹图谱的景观分析方法及用途。
技术介绍
如何辨识基因组不同组装版本的序列的差异,如何校验基因组序列的组装质量,如何检测基因组序列中的大尺度重复序列,是亟待解决的技术问题。建立一种新方法,集中展示待比较的基因组序列的指纹图谱,观察比较指纹图谱的景观差异,是解决上述技术问题的一种技术方案,有广泛应用前景。我们之前的专利文献公告CN103106353A公开“一种基因组序列的指纹特征曲线的构造方法”,具体包括建立基因组序列中的每个碱基所对应的三维空间坐标值(xn,yn,zn)(n=1,2,…,N;N为基因组序列的长度)的方法;依据三维空间坐标值,绘制1个三维空间曲线(xn~yn~zn)的方法;依据三维空间坐标值,分别绘制独立存在的6个(xn~n),(yn~n),(zn~n),(yn~xn),(zn~xn),(zn~yn)二维平面轨迹曲线的方法。本专利技术采用该专利文献公告CN103106353A作为对比文件,以其公开的技术作为现有的对比技术。本专利技术以此对比技术为基础,进一步建立新方法及新用途。
技术实现思路
本专利技术的内容是,公开2个新方法及3个新用途。首先,本专利技术的方法是,组合构造2个基因组序列的指纹图谱,包括1个基因组序列的指纹图谱(amapofgenomefingerprints)及1组(含2个或2个以上的)基因组序列的指纹图谱云图(agalaxyofgenomefingerprintsmaps)。以下将采用中英文对照,以确切体现2个新概念的内涵。本专利技术所称谓的“基因组序列的指纹图谱(amapofgenomefingerprints)”,是一幅组合图;包含1个基因组序列的指纹组合。意指采用专利文献公告CN103106353A公开的技术方法,先计算1个基因组序列中的每个碱基所对应的三维空间坐标值(xn,yn,zn)(n=1,2,…,N;N为基因组序列的长度);再依据三维空间坐标值,在同一幅组合图中绘制1个基因组序列所对应的1个三维空间曲线图(xn~yn~zn);再依据三维空间坐标值,在同一幅组合图中同时绘制1个基因组序列所对应的6个二维平面轨迹曲线图(xn~n),(yn~n),(zn~n),(yn~xn),(zn~xn),(zn~yn),共同构成1幅组合图,代表1个基因组序列的指纹组合。本专利技术所称谓的“基因组序列的指纹图谱云图(agalaxyofgenomefingerprintsmaps)”,是一幅组合图;包含1组(含2个或2个以上的)基因组序列的指纹图谱的组合。意指在同一幅组合图中同时绘制2个或2个以上的基因组序列的所有指纹图谱的组合,共同构成1幅组合图,代表1组(含2个或2个以上的)基因组序列的指纹组合。简言之,1组(含2个或2个以上的)基因组序列的“指纹图谱(amapofgenomefingerprints)”共同组合而成“指纹图谱云图(agalaxyofgenomefingerprintsmaps)”。其次,本专利技术的用途是,依据比较分析本专利技术所组合构造的指纹图谱的综合景观差异,实现3个用途:(1)辨识同一个基因组不同组装版本的序列的差异;(2)校验基因组序列的组装质量;(3)检测基因组序列中的大尺度重复序列。为了解决上述的技术问题,本专利技术公开的技术方案包括建立2个新方法以及实现3个新用途。具体描述如下。首先,建立2个新方法。组合构造1个基因组序列的指纹图谱(amapofgenomefingerprints);组合构造1组(含2个或2个以上的)基因组序列的指纹图谱云图(agalaxyofgenomefingerprintsmaps)。目的是全局集中展示待比较的1个基因组序列之内的指纹图谱或者是1组(含2个或2个以上的)基因组序列之间的指纹图谱云图。方法之1:组合构造1个基因组序列的指纹图谱(amapofgenomefingerprints),针对给定的1个基因组序列,首先采用专利文献公告CN103106353A公开的技术方法,计算每个碱基的三维空间坐标值(xn,yn,zn)(n=1,2,…,N;N为基因组序列的长度);然后采用绘图软件,依据三维空间坐标值,在同一幅组合图中同时绘制6个二维平面轨迹曲线图(xn~n),(yn~n),(zn~n),(yn~xn),(zn~xn),(zn~yn);还可以在同一幅组合图中同时绘制1个三维空间曲线图(xn~yn~zn)。这种组合图,全局展示1个基因组序列的指纹图谱,观察和比较的视野开阔。例如,实施例1中提及的图1,注意图1中基因组序列的长度n被表示为GenomeLength。又例如,实施例6中提及的图6。方法之2:组合构造1组(含2个或2个以上的)基因组序列的指纹图谱云图(agalaxyofgenomefingerprintsmaps),针对给定的1组(含2个或2个以上的)基因组序列,首先逐一选择每个基因组序列,并采用专利文献公告CN103106353A公开的技术方法,计算每个碱基的三维空间坐标值(xn,yn,zn)(n=1,2,…,N;N为基因组序列的长度));然后采用绘图软件,分别依据所获得的每个基因组序列的三维空间坐标值,在同一幅组合图中同时绘制每个基因组序列所对应的6个二维平面轨迹曲线图(xn~n),(yn~n),(zn~n),(yn~xn),(zn~xn),(zn~yn);还可以在同一幅组合图中同时绘制每个基因组序列所对应的1个三维空间曲线图(xn~yn~zn)。这种组合图,全局展示1组(含2个或2个以上的)基因组中的所有基因组序列的指纹图谱,观察和比较的视野更开阔。例如,实施例3中提及的图3,注意图3中基因组序列的长度n被表示为GenomeLength。其次,实现3个新用途。观察如前述的本专利技术所组合构造的指纹图谱和指纹图谱云图,比较和分析指纹图谱的综合景观的差异。目的是判定:(1)辨识同一个基因组的不同组装版本之间的序列的差异;(2)校验基因组序列的组装质量;(3)检测基因组序列中的大尺度重复序列。用途之1:辨识同一个基因组的不同组装版本之间的序列差异,例如,实施实例1中提及图1,辨识同一个基因组的2个组装版本之间的序列差异,结果发现显示完全不同的指纹图谱云图。又例如,实施实例2中提及图2,辨识同一个基因组的3次更新的组装版本之间的序列差异,结果显示完全相同的指纹图谱云图。用途之2:校验基因组序列的组装质量,例如,实施实例3中提及图3,辨识同一个物种大猩猩中2个个体GGO3和Susie3之间的第4号染色体的基因组序列的差异,结果显示它们的指纹图谱略有不同,但是相近似;符合个体水平的差异程度。但是,又例如,实施实例4中提及图4,辨识2个近缘的物种的第4号染色体大猩猩GGO3.chr4与黑猩猩PTR2.chr4之间基因组序列的差异,结果发现大猩猩GGO3.chr4在指纹图谱上存在大尺度的异常直线(注意观察(y~x),(x~GenomeLength),(z~x),(y~GenomeLength),(z~y)分图)(图4),提示可能存在大尺度的组装错误,达到校验基因组序列的组装质量的目的。又例如,实施例6中提及的图6。用途之3:检测基因组序列中的本文档来自技高网...
一种基因组序列的指纹图谱的景观分析方法及用途

【技术保护点】
一种基因组序列的指纹图谱的景观分析的方法,其特征是组合构造1个基因组序列的指纹图谱(a map of genome fingerprints);所谓的基因组序列的指纹图谱,其特征在于是一幅组合图,采用专利文献公告CN103106353A公开的技术方法,首先计算1个基因组序列中的每个碱基的三维空间坐标值(x

【技术特征摘要】
1.一种基因组序列的指纹图谱的景观分析的方法,其特征是组合构造1个基因组序列的指纹图谱(amapofgenomefingerprints);所谓的基因组序列的指纹图谱,其特征在于是一幅组合图,采用专利文献公告CN103106353A公开的技术方法,首先计算1个基因组序列中的每个碱基的三维空间坐标值(xn,yn,zn)(n=1,2,…,N;N为基因组序列的长度),然后在同一幅组合图中同时绘制1个基因组序列所对应的6个二维平面轨迹曲线图(xn~n),(yn~n),(zn~n),(yn~xn),(zn~yn),(zn~xn);还可以在同一幅组合图中绘制1个基因组序列所对应的1个三维空间曲线图(xn~yn~zn)。2.一种基因组序列的指纹图谱的景观分析的方法,其特征是组合构造1组(2个或2个以上)基因组序列的指纹图谱云图(agalaxyofgenomefingerprintsmaps)...

【专利技术属性】
技术研发人员:艾云灿艾汉南孟繁梅
申请(专利权)人:艾云灿艾汉南孟繁梅
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1