短串联重复序列的致病性分析方法、装置及服务器制造方法及图纸

技术编号:32129974 阅读:18 留言:0更新日期:2022-01-29 19:27
本申请公开了一种短串联重复序列的致病性分析方法、装置及服务器。该致病性分析方法包括:在WES或WGS数据中筛查出序列集;利用预设分析软件分析所述序列集中的短串联重复序列;根据分析结果从所述序列集中筛除不符合预设筛选条件的短串联重复序列,得到致病序列集。能够充分挖掘WES数据的潜在价值,探究短串联重复的异常扩增与疾病的关系,能够规范、快速、便捷的对短串联重复序列致病性进行细致的分析和解读,且有效减少在分析解读工作中人力、物力资源浪费。本申请解决了短串联重复序列致病性分析和解读不规范,以及在分析解读工作中造成大量的人力、物力资源的浪费的技术问题。题。题。

【技术实现步骤摘要】
短串联重复序列的致病性分析方法、装置及服务器


[0001]本申请涉及数据分析领域,具体而言,涉及一种短串联重复序列的致病性分析方法、装置及服务器。

技术介绍

[0002]专利技术人发现,WES数据仅仅运用于从中识别短串联重复的异常扩增,但是并未充分挖掘WES数据的潜在价值,探究短串联重复的异常扩增与疾病的关系,造成短串联重复序列致病性分析和解读不规范,以及在分析解读工作中造成大量的人力、物力资源的浪费。
[0003]针对相关技术中短串联重复序列致病性分析和解读不规范,以及在分析解读工作中造成大量的人力、物力资源的浪费的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请的主要目的在于提供一种短串联重复序列的致病性分析方法、装置及服务器,以解决短串联重复序列致病性分析和解读不规范,以及在分析解读工作中造成大量的人力、物力资源的浪费的问题。
[0005]为了实现上述目的,根据本申请的一个方面,提供了一种短串联重复序列的致病性分析方法。
[0006]根据本申请的短串联重复序列的致病性分析方法包括:在WES或WGS数据中筛查出序列集;利用预设分析软件分析所述序列集中的短串联重复序列;根据分析结果从所述序列集中筛除不符合预设筛选条件的短串联重复序列,得到致病序列集。
[0007]进一步的,在WES或WGS数据中筛查出序列集包括:参考在GRCH37人类参考基因组上的物理位置、重复序列,分析并筛查出WES/WGS数据中的所有短串联重复序列,作为序列集。
[0008]进一步的,所述预设分析软件包括:Expansion Hunter、GangSTR、STRetch、HipSTR、TRhist、TREDPARSE、Expansion Hunter Denov中的任意一种。
[0009]进一步的,利用预设分析软件分析所述序列集中的短串联重复序列包括:利用Expansion Hunter软件分析所述序列集中的短串联重复序列,得到VCF格式文件和JSON格式文件;从VCF格式文件中提取短串联重复次数及低质量的短串联重复序列的标记信息。
[0010]进一步的,根据分析结果从所述序列集中筛除不符合预设筛选条件的短串联重复序列,得到致病序列集包括:根据标记信息从序列集中筛除标记为低质量的短串联重复序列;判断短串联重复次数是否高于预设致病阈值;如果是,则从筛除标记为低质量的短串联重复序列的序列集中筛除高于预设致病阈值的短串联重复序列,得到致病序列集。
[0011]为了实现上述目的,根据本申请的另一方面,提供了一种短串联重复序列的致病性分析装置。
[0012]根据本申请的短串联重复序列的致病性分析装置包括:数据筛查模块,用于在WES或WGS数据中筛查出序列集;序列分析模块,用于利用预设分析软件分析所述序列集中的短
串联重复序列;序列筛除模块,用于根据分析结果从所述序列集中筛除不符合预设筛选条件的短串联重复序列,得到致病序列集。
[0013]进一步的,所述数据筛查模块包括:参考在GRCH37人类参考基因组上的物理位置、重复序列,分析并筛查出WES/WGS数据中的所有短串联重复序列,作为序列集。
[0014]进一步的,所述序列分析模块包括:利用Expansion Hunter软件分析所述序列集中的短串联重复序列,得到VCF格式文件和JSON格式文件;从VCF格式文件中提取短串联重复次数及低质量的短串联重复序列的标记信息。
[0015]进一步的,所述序列筛除模块包括:根据标记信息从序列集中筛除标记为低质量的短串联重复序列;判断短串联重复次数是否高于预设致病阈值;如果是,则从筛除标记为低质量的短串联重复序列的序列集中筛除高于预设致病阈值的短串联重复序列,得到致病序列集。
[0016]为了实现上述目的,根据本申请的另一方面,提供了一种服务器。
[0017]根据本申请的服务器,包括:存储器和处理器,所述存储器中存储有计算机程序,其中,所述处理器被设置为运行所述计算机程序以执行上述任一项所述的积分展示方法。
[0018]在本申请实施例中,采用分析短串联重复序列的致病性的方式,通过在WES 或WGS数据中筛查出序列集;利用预设分析软件分析所述序列集中的短串联重复序列;根据分析结果从所述序列集中筛除不符合预设筛选条件的短串联重复序列,得到致病序列集;达到了能够充分挖掘WES数据的潜在价值,探究短串联重复的异常扩增与疾病的关系的目的,从而实现了规范、快速、便捷的对短串联重复序列致病性进行细致的分析和解读,且有效减少在分析解读工作中人力、物力资源浪费的技术效果,进而解决了短串联重复序列致病性分析和解读不规范,以及在分析解读工作中造成大量的人力、物力资源的浪费的技术问题。
附图说明
[0019]构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0020]图1是根据本申请实施例的短串联重复序列的致病性分析方法的流程示意图;
[0021]图2是根据本申请实施例的短串联重复序列的致病性分析装置的结构示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0023]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的
过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0024]在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本专利技术及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
[0025]并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本专利技术中的具体含义。
[0026]此外,术语“安装”、“设置”、“设有”、“连接”、“相连”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种短串联重复序列的致病性分析方法,其特征在于,包括:在WES或WGS数据中筛查出序列集;利用预设分析软件分析所述序列集中的短串联重复序列;根据分析结果从所述序列集中筛除不符合预设筛选条件的短串联重复序列,得到致病序列集。2.根据权利要求1所述的致病性分析方法,其特征在于,在WES或WGS数据中筛查出序列集包括:参考在GRCH37人类参考基因组上的物理位置、重复序列,分析并筛查出WES/WGS数据中的所有短串联重复序列,作为序列集。3.根据权利要求1所述的致病性分析方法,其特征在于,所述预设分析软件包括:Expansion Hunter、GangSTR、STRetch、HipSTR、TRhist、TREDPARSE、Expansion Hunter Denov中的任意一种。4.根据权利要求1所述的致病性分析方法,其特征在于,利用预设分析软件分析所述序列集中的短串联重复序列包括:利用Expansion Hunter软件分析所述序列集中的短串联重复序列,得到VCF格式文件和JSON格式文件;从VCF格式文件中提取短串联重复次数及低质量的短串联重复序列的标记信息。5.根据权利要求4所述的致病性分析方法,其特征在于,根据分析结果从所述序列集中筛除不符合预设筛选条件的短串联重复序列,得到致病序列集包括:根据标记信息从序列集中筛除标记为低质量的短串联重复序列;判断短串联重复次数是否高于预设致病阈值;如果是,则从筛除标记为低质量的短串联重复序列的序列集中筛...

【专利技术属性】
技术研发人员:李滨李津臣赵贵虎周巧
申请(专利权)人:中南大学湘雅医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1