一种拷贝数变异分析方法、系统及计算机可读存储介质技术方案

技术编号:22818675 阅读:20 留言:0更新日期:2019-12-14 13:43
一种拷贝数变异分析方法,其特征在于,该方法包括:数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群CNV数据库、基因组结构变异数据库及综合征及一些病例数据库;根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息。本发明专利技术通过将在数据库中整合正常人群数据库、基因组结构变异数据库及综合征及一些病例数据库,按照基因组位置排序并建立索引,使得用户能够根据基因组位置引用相关联的注释信息。

A copy number variation analysis method, system and computer readable storage medium

【技术实现步骤摘要】
一种拷贝数变异分析方法、系统及计算机可读存储介质
本专利技术属于拷贝数变异(CNV)注释
,尤其涉及一种拷贝数变异注释以及对于CNV的临床意义判断和解读的分析方法;用于拷贝数变异注释以及对于CNV的临床意义判断和解读的分析系统;以及用于实现该分析系统的计算机可读存储介质。
技术介绍
拷贝数变异(CNV,copynumbervariant)是一类染色体亚显微水平的结构变异,即染色体的某些区域或基因片段在基因组中发生了重复或缺失,有研究称基因组中有约12%的区域易于发生CNV。异常的拷贝数变化是许多人类疾病(如癌症、遗传性疾病、心血管疾病等)的一种重要分子机制。然而目前缺乏快速、全面注释包含这些数据库信息的软件及方法,只能手动依次去这些数据库网站上搜寻,非常不便。另一方面,目前的CNV主要是通过染色体芯片分析(CMA芯片)和NGS方法进行检测。由于检测技术的限制,都很难准确的检测到CNV的断点。这也为判断两个CNV是否为同一CNV判定带来了难度。因此,一种能够便捷地为CNV注释并智能判断致病性的分析方法成为实际需求。
技术实现思路
本专利技术的目的在于提供一种拷贝数变异分析方法、系统及计算机可读存储介质,旨在解决现有技术对CNV手动注释不便捷,致病性判断不智能的问题。为了解决上述技术问题,本专利技术提供了一种拷贝数变异分析方法,其特征在于,该方法包括:数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群CNV数据库、基因组结构变异数据库及综合征及一些病例数据库;r>根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息;以基因组结构变异数据库及综合征及一些病例数据库中引用的注释信息为第一序列判断待注释CNV的致病性;当第一序列判断不成立时,以正常人群数据库引用的注释信息为第二序列判断待注释CNV的致病性。具体地,第一序列中:根据CNV相似性算法在所述基因组结构变异数据库中匹配出与待注释CNV相似的若干个已注释CNV,根据CNV覆盖算法在所述若干个已注释CNV中匹配出与待注释CNV相覆盖的已注释CNV,索引与所述待注释CNV相覆盖的已注释CNV的基因组位置,引用所述基因组结构变异数据库中与所述已注释CNV的基因组位置相关联的临床意义和表型信息。具体地,第一序列中:根据CNV相似性算法在所述综合征及一些病例数据库的综合征子数据库中匹配出与待注释CNV相似的若干个已注释CNV,根据CNV覆盖算法在所述若干个已注释CNV中匹配出与待注释CNV相覆盖的已注释CNV,索引与所述待注释CNV相覆盖的已注释CNV的基因组位置,引用所述综合征子数据库中与所述已注释CNV的基因组位置相关联的综合征信息;根据CNV相似性算法在所述综合征及一些病例数据库的人群子数据库中匹配出与待注释CNV相似的若干个已注释CNV,索引与所述待注释CNV相似的若干个已注释CNV的基因组位置,引用所述综合征及一些病例数据库的人群子数据库中与所述若干个已注释CNV的基因组位置相关联的人群频率信息;索引与所述待注释CNV相似的若干个已注释CNV的基因组位置,引用所述综合征及一些病例数据库的单倍不足预测子数据库中与所述若干个已注释CNV的基因组位置相关联的单倍不足基因信息。具体地,所述数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群数据库、基因组结构变异数据库及综合征及一些病例数据库;根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息的步骤中:所述数据库按基因组位置排序后建立基因组位置索引,所述数据库还包括基因信息数据库及染色体区带信息数据库;根据待注释CNV的染色体、基因组起始位置及基因组终止位置索引基因信息数据库中相对应的基因组位置,引用所述基因信息数据库中与所述基因组位置相关联的基因信息;根据待注释CNV的染色体、基因组起始位置及基因组终止位置索引染色体区带信息数据库中相对应的基因组位置,引用所述染色体区带信息数据库中与所述基因组位置相关联的染色体区带信息。具体地,所述数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群数据库、基因组结构变异数据库及综合征及一些病例数据库;根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息的步骤中:数据库按基因组位置排序后建立基因组位置索引,所述数据库还包括综合性肿瘤数据库;根据CNV相似性算法在所述综合性肿瘤数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述综合性肿瘤数据库中与所述已注释CNV的基因组位置相关联的注释信息。一种拷贝数变异分析系统,所述系统包括:数据库单元,按基因组位置排序后建立基因组位置索引,所述基因组位置与对应的注释信息相关联,所述数据库单元存储有正常人群数据库、基因组结构变异数据库及综合征及一些病例数据库;算法单元,采用CNV相似性算法或CNV覆盖算法在所述数据库中单元中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置;注释单元,引用所述数据库单元中与所述已注释CNV的基因组位置相关联的注释信息;致病性判断单元,以基因组结构变异数据库及综合征及一些病例数据库中引用的注释信息为第一序列判断待注释CNV的致病性;当第一序列判断不成立时,以正常人群数据库引用的注释信息为第二序列判断待注释CNV的致病性;所述数据库单元分别与算法单元和注释单元相连接,所述致病性判断单元与注释单元相连接。具体地,所述综合征及一些病例数据库还存储有综合征子数据库、人群子数据库和单倍不足预测子数据库,所述注释信息包括临床意义、表型信息、人群频率信息和单倍不足基因信息,所述算法单元根据CNV相似性算法在所述基因组结构变异数据库中匹配出与待注释CNV相似的若干个已注释CNV,所述算法单元根据CNV覆盖算法在所述若干个已注释CNV中匹配出与待注释CNV相覆盖的已注释CNV,所述数据库单元索引与所述待注释CNV相覆盖的已注释CNV的基因组位置,引用所述基因组结构变异数据库中与所述已注释CNV的基因组位置相关联的临床意义和表型信息;所述算法单元根据CNV相似性算法在所述综合征及一些病例数据库的综合征子数据库中匹配出与待注释CNV相似的若干个已注释CNV,所述算法单元根据CNV覆盖算法在所述若干个已注释CNV中匹配出与待注释CNV相覆盖的已注释CNV,所述数据库索引与所述待注释CNV相覆盖的已注释CNV的基因组位置,引用所述综合征子数据库中与所述已注释CN本文档来自技高网...

【技术保护点】
1.一种拷贝数变异分析方法,其特征在于,该方法包括:/n数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群CNV数据库、基因组结构变异数据库及综合征及一些病例数据库;/n根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息;/n以基因组结构变异数据库及综合征及一些病例数据库中引用的注释信息为第一序列判断待注释CNV的致病性;当第一序列判断不成立时,/n以正常人群CNV数据库引用的注释信息为第二序列判断待注释CNV的致病性。/n

【技术特征摘要】
1.一种拷贝数变异分析方法,其特征在于,该方法包括:
数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群CNV数据库、基因组结构变异数据库及综合征及一些病例数据库;
根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息;
以基因组结构变异数据库及综合征及一些病例数据库中引用的注释信息为第一序列判断待注释CNV的致病性;当第一序列判断不成立时,
以正常人群CNV数据库引用的注释信息为第二序列判断待注释CNV的致病性。


2.根据权利要求1所述的拷贝数变异分析方法,其特征在于,第一序列中:
根据CNV相似性算法在所述基因组结构变异数据库中匹配出与待注释CNV相似的若干个已注释CNV,
根据CNV覆盖算法在所述若干个已注释CNV中匹配出与待注释CNV相覆盖的已注释CNV,
索引与所述待注释CNV相覆盖的已注释CNV的基因组位置,引用所述基因组结构变异数据库中与所述已注释CNV的基因组位置相关联的临床意义和表型信息。


3.根据权利要求2所述的拷贝数变异分析方法,其特征在于,第一序列中:
根据CNV相似性算法在所述综合征及一些病例数据库的综合征子数据库中匹配出与待注释CNV相似的若干个已注释CNV,
根据CNV覆盖算法在所述若干个已注释CNV中匹配出与待注释CNV相覆盖的已注释CNV,
索引与所述待注释CNV相覆盖的已注释CNV的基因组位置,引用所述综合征子数据库中与所述已注释CNV的基因组位置相关联的综合征信息;
根据CNV相似性算法在所述综合征及一些病例数据库的人群子数据库中匹配出与待注释CNV相似的若干个已注释CNV,
索引与所述待注释CNV相似的若干个已注释CNV的基因组位置,引用所述综合征及一些病例数据库的人群子数据库中与所述若干个已注释CNV的基因组位置相关联的人群频率信息;
索引与所述待注释CNV相似的若干个已注释CNV的基因组位置,引用所述综合征及一些病例数据库的单倍不足预测子数据库中与所述若干个已注释CNV的基因组位置相关联的单倍不足基因信息。


4.根据权利要求1所述的拷贝数变异分析方法,其特征在于,所述数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群CNV数据库、基因组结构变异数据库及综合征及一些病例数据库;根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息的步骤中:
所述数据库按基因组位置排序后建立基因组位置索引,所述数据库还包括基因信息数据库及染色体区带信息数据库;
根据待注释CNV的染色体、基因组起始位置及基因组终止位置索引基因信息数据库中相对应的基因组位置,引用所述基因信息数据库中与所述基因组位置相关联的基因信息;
根据待注释CNV的染色体、基因组起始位置及基因组终止位置索引染色体区带信息数据库中相对应的基因组位置,引用所述染色体区带信息数据库中与所述基因组位置相关联的染色体区带信息。


5.根据权利要求1所述的拷贝数变异分析方法,其特征在于,所述数据库按基因组位置排序后建立基因组位置索引,所述数据库包括正常人群CNV数据库、基因组结构变异数据库及综合征及一些病例数据库;根据CNV相似性算法或CNV覆盖算法在所述数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述数据库中与所述已注释CNV的基因组位置相关联的注释信息的步骤中:
数据库按基因组位置排序后建立基因组位置索引,所述数据库还包括综合性肿瘤数据库;
根据CNV相似性算法在所述综合性肿瘤数据库中索引与待注释CNV的基因组相对应的已注释CNV的基因组位置,引用所述综合性肿瘤数据库中与所述已注释C...

【专利技术属性】
技术研发人员:谭博文黄晶盈
申请(专利权)人:深圳百诺精准医疗科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利