一种染色体非整倍体的分析方法及系统技术方案

技术编号:24013006 阅读:45 留言:0更新日期:2020-05-02 02:23
本发明专利技术提供一种染色体非整倍体分析方法及系统。本发明专利技术所述方法基于Zscore算法对样本测序深度进行统计分析,并结合样本SNP等位基因频率统计分析,综合判定染色体非整倍体情况。本发明专利技术所述方法准确度高,不受待测样本SNP位点数的影响,特异性、灵敏度高,可达到100%,还可判断异常染色体为缺失或扩增。

An analysis method and system of chromosome aneuploidy

【技术实现步骤摘要】
一种染色体非整倍体的分析方法及系统
本专利技术涉及基因工程
,特别是涉及一种染色体非整倍体的数据分析方法及系统。
技术介绍
肿瘤,尤其是脑肿瘤病变过程中,细胞会发生非平衡易位,导致丢失/增加染色体某个长短臂,甚至是整个染色体。脑胶质瘤(Glioma)是最常见的颅内原发恶性肿瘤,在成年人中,胶质瘤是最常见的原发性颅内肿瘤,约占所有脑部肿瘤的30~40%。在原发性恶性中枢神经系统肿瘤中,胶质母细胞瘤(Glioblastoma)的发病率最高,占了46.1%。全球,胶质母细胞瘤的发病率或者新就诊数量约为每10万人里面有2至3人,中位发病年龄为65岁,中位生存期为14.6个月,整体治疗效果并不理想。临床上,胶质母细胞瘤具有病程短、病状发展迅速、术后高复发性、低治愈率的特点。临床上多采用放射性核素扫描检查、脑部CT或者核磁共振检查的诊断方法,但是此类病人由于脑瘤血管内皮细胞结合较为紧密,趋于正常,血脑屏障较为良好,不发生或者较少发生造影剂血管外溢,因而头颅MRI效果不佳;并且此类疾病病情初期容易和其他疾病混淆,导致延误治疗时机。目前,2016版WHO中枢神经系统肿瘤分类已经在组织学基础上加入了分子学特征,采用“综合诊断”去诊断胶质母细胞瘤,该“综合诊断”整合了组织病理和基因型参数,提高了胶质瘤分型、诊断、预后和治疗决策的准确性,其中1p/19q联合缺失(1p/19qLOH)是少突胶质瘤的重要分子指标,与O形态紧密相关,且影响患者预后和放/化疗疗效相关。目前,常用于检测lp/19qLOH的方法包括:荧光原位杂交(fluorescentinsituhybridization,FISH)和一代测序的方法。其中,荧光原位杂交是目前临床病理检胶质瘤样本中1p/19q联合缺失的金标准方法。但实体瘤染色体的制备和显带都比较困难,需要有丰富经验的专业人员操作,并且探针数量有限,通量小、时间长。只能检测1p、19q上小部分固定位置的缺失情况。现有技术中很少有提出NGS检测1p19qLOH的方法,部分只涉及基于SNP的分布差异信号来检测染色体是否缺失,没有利用测序深度的信号,其缺点显著:1)只能判断染色体是否整倍体,而不能进一步判断异常染色体为缺失还是扩增;2)待测样本的杂合SNP位点数不固定,如果都是纯合SNP或者杂合SNP位点过少,将直接影响该样本的检测准确度。因此,现有技术中亟需一种准确度更高的NGS检测1p19qLOH的方法。
技术实现思路
本专利技术的目的在于提供一种染色体非整倍体的检测方法,以至少缓解现有技术中存在的技术问题之一。为实现上述目的,本专利技术采用如下技术方案:一种染色体非整倍体的数据分析方法,所述方法为步骤1)基于Zscore算法对基因测序样本的测序深度进行统计分析;步骤2)对基因测序样本的SNP等位基因频率进行统计分析;结合步骤1)和2)判定染色体为/不为非整倍体。在一些实施方式中,所述步骤1)为基于Zscore算法对样本测序深度进行统计分析得到信号值1(Sig_value);步骤2)对样本SNP等位基因频率进行统计分析得到信号值2(SNP_ratio);基于Cutoff值评价信号值1和2,判定目标染色体为/不为非整倍体;优选的,当样本信号值1(Sig_value)、信号值2(SNP_ratio)同时处于/未处于Cutoff范围内,判定目标染色体为/不为非整倍体。在一些实施方式中,所述步骤1)包括将染色体目标区域每个基因位点测序深度参考阴性样本数据集进行标准化,标准化后的数据参考阴性样本数据集计算Zscore,信号值1(Sig_value)为目标染色体区域每个基因位点Zscore之和,即Sig_value计算方式为:其中,N表示该检测区域的基因位点总数,j表示染色体目标区域第j位;优选地,所述测序深度为去PCR重复后的测序深度。在一些实施方式中,所述步骤2)包括:统计样本SNP等位基因频率在0.4~0.6范围的SNP个数N1以及样本SNP等位基因频率在0~0.9范围的SNP个数N2,信号值2(SNP_ratio)=N1/N2;优选地,样本SNP等位基因频率为样本SNP位点测序深度>100的等位基因频率。在一些实施方式中,所述染色体为1p、7、10和/或19q,优选的为1p和19q。在一些实施方式中,所述用于染色体19q非整倍体数据分析的步骤1)包括:将染色体19q以及染色体19p每个基因位点测序深度参考阴性样本数据集进行标准化,形成染色体19q标准化测序深度集、染色体19p标准化测序深度集,Zscore取标准化测序深度集中的中位数,信号值1(Sig_value)=Zscore19q-Zscore19p。在一些实施方式中,所述染色体1p的Sig_value的Cutoff为-40,000~-15,000,SNP_ratio的Cutoff为0.1~0.6;所述染色体19q的Sig_value的Cutoff为-1~-0.7,SNP_ratio的Cutoff为0.4~0.7;优选的,1p和19q的cutoff值分别为CutoffSig_value-1p=-20000、CutoffSNP_ratio-1p=0.4、CutoffSig_value-19q=-0.9、CutoffSNP_ratio-19q=0.4。本专利技术还涉及一种染色体非整倍体的数据分析系统,所述系统包括信息输入模块:将测序数据传输至Zscore分析模块、SNP等位基因频率分析模块;所述Zscore分析模块是基于Zscore算法对基因测序样本的测序深度进行统计分析得到信号值1(Sig_value);所述SNP等位基因频率分析模块是对基因测序样本的SNP等位基因频率进行统计分析得到信号值2(SNP_ratio);结果判断模块:基于Cutoff值评价信号值1和2,判定目标染色体为/不为非整倍体;优选的,当样本信号值1(Sig_value)、信号值2(SNP_ratio)同时处于/未处于Cutoff范围内,判定目标染色体为/不为非整倍体。在一些实施方式中,所述Zscore分析模块包括将染色体目标区域每个基因位点测序深度参考阴性样本数据集进行标准化,标准化后的数据参考阴性样本数据集计算Zscore,信号值1(Sig_value)为目标染色体区域每个基因位点Zscore之和,即Sig_value计算方式为:其中,N表示该检测区域的基因位点总数,j表示染色体目标区域第j位;优选地,所述测序深度为去PCR重复后的测序深度。所述SNP等位基因频率分析模块包括统计样本SNP等位基因频率在0.4~0.6范围的SNP个数N1以及样本SNP等位基因频率在0~0.9范围的SNP个数N2,信号值2(SNP_ratio)=N1/N2;优选地,样本SNP等位基因频率为样本SNP位点测序深度>100的等位基因频率。在一些实施方式中,所述染色体为1p、7、10和/或19q,优选的为1p和19q。在一些实施方式中,所述用本文档来自技高网
...

【技术保护点】
1.一种染色体非整倍体分析方法,其特征在于,所述方法包括:/n步骤1)基于Zscore算法对基因测序样本的测序深度进行统计分析;/n步骤2)对基因测序样本的SNP等位基因频率进行统计分析;/n结合步骤1)和2)判定染色体为/不为非整倍体。/n

【技术特征摘要】
1.一种染色体非整倍体分析方法,其特征在于,所述方法包括:
步骤1)基于Zscore算法对基因测序样本的测序深度进行统计分析;
步骤2)对基因测序样本的SNP等位基因频率进行统计分析;
结合步骤1)和2)判定染色体为/不为非整倍体。


2.根据权利要求1所述的数据分析方法,其特征在于,所述方法包括:
步骤1)基于Zscore算法对样本测序深度进行统计分析得到信号值1Sig_value;
步骤2)对样本SNP等位基因频率进行统计分析得到信号值2SNP_ratio;
基于Cutoff值评价信号值1和2,判定目标染色体为/不为非整倍体;优选的,当样本信号值1Sig_value、信号值2SNP_ratio同时处于/未处于Cutoff范围内,判定目标染色体为/不为非整倍体。


3.根据权利要求2所述的数据分析方法,其特征在于,步骤1)包括将染色体目标区域每个基因位点测序深度参考阴性样本数据集进行标准化,标准化后的数据参考阴性样本数据集计算Zscore,信号值1Sig_value为目标染色体区域每个基因位点Zscore之和,即Sig_value计算方式为:



其中,N表示该检测区域的基因位点总数,j表示染色体目标区域第j位;
优选地,所述测序深度为去PCR重复后的测序深度。


4.根据权利要求1-3任一所述的数据分析方法,其特征在于,所述步骤2)包括:统计样本SNP等位基因频率在0.4~0.6范围的SNP个数N1以及样本SNP等位基因频率在0~0.9范围的SNP个数N2,信号值2SNP_ratio=N1/N2;
优选地,样本SNP等位基因频率为样本SNP位点测序深度>100的等位基因频率。


5.根据权利要求1-4任一所述的数据分析方法,其特征在于,所述染色体为1p、7、10和/或19q,优选的为1p和19q。


6.根据权利要求5所述的数据分析方法,其特征在于,所述染色体1p的Sig_value的Cutoff为-40,000~-15,000,SNP_ratio的Cutoff为0.1~0.6;所述染色体19q的Sig_value的Cutoff为-1~-0.7,SNP_ratio的Cutoff为0.4~0.7;优选的,1p和19q的cutoff值分别为CutoffSig_value-1p=-20000、CutoffSNP_ratio-1p=0.4、CutoffSig_value-19...

【专利技术属性】
技术研发人员:吴增丁邓望龙肖念清任用
申请(专利权)人:江苏先声医学诊断有限公司南京先声医学检验有限公司江苏先声医疗器械有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1