【技术实现步骤摘要】
本专利技术涉及测序数据处理领域,具体而言,涉及一种测序数据的处理方法和处理装置。
技术介绍
染色体异常可能是数目上的或结构上的。数量异常,包括三体性(多一个染色体)、单体性(丢一个染色体)和多倍性(整个多一套染色体)。结构异常包括由染色体断裂等引起的结构性重排,如易位、翻转、缺失和插入。染色体数量异常,如非整倍性和多倍性,与多种疾病包括出生缺陷及癌症有关。我国每年新生儿近2000万,其中约4%~6%存在出生缺陷,其中胎儿染色体异常是临床最常见的出生缺陷类型之一,据统计约160例新生儿中就有1例是染色体异常患者。染色体三体综合征是染色体疾病中发病率最高的一类,当细胞内某染色体的数目不是正常的两条而是三条,也即染色体总数目为47条时就会导致三体综合征。最常见的染色体三体综合征有:21三体综合征(T21)、18三体综合征(T18)和13三体综合征(T13)。为减少出生缺陷婴儿的比例,对染色体非整倍性的快速、准确的检测是必要的。超声波扫描技术或生物化学标记物筛查的无创方法,已用于进行染色体异常的风险判断,但该方法准确率较低,仅为60-80%,且受孕龄等生理因素的影响。而 ...
【技术保护点】
一种测序数据的处理方法,其特征在于,所述处理方法包括:通过高通量测序获取来源于母体外周血样本的所有染色体的核苷酸序列信息;将参考基因组划分成多个特异性区域,每个所述特异性区域内非重复序列的数目NRSc值相等;将所述来源于母体外周血样本的所有染色体的核苷酸序列信息分配至所述参考基因组的多个所述特异性区域,统计所述样本在每个所述特异性区域内的NRSs值;利用GC含量修正所述样本在每个所述特异性区域内的NRSs值,记为NRSs'值;基于所述NRSs'值,分别统计目标染色体和对照染色体上所有特异性区域的NRSs'值的均值,分别对应记为第一均值和第二均值;将所述第一均值与第二均值进行 ...
【技术特征摘要】
1.一种测序数据的处理方法,其特征在于,所述处理方法包括:通过高通量测序获取来源于母体外周血样本的所有染色体的核苷酸序列信息;将参考基因组划分成多个特异性区域,每个所述特异性区域内非重复序列的数目NRSc值相等;将所述来源于母体外周血样本的所有染色体的核苷酸序列信息分配至所述参考基因组的多个所述特异性区域,统计所述样本在每个所述特异性区域内的NRSs值;利用GC含量修正所述样本在每个所述特异性区域内的NRSs值,记为NRSs'值;基于所述NRSs'值,分别统计目标染色体和对照染色体上所有特异性区域的NRSs'值的均值,分别对应记为第一均值和第二均值;将所述第一均值与第二均值进行差异性检验,根据差异检验结果确定染色体是否存在非整倍性。2.根据权利要求1所述的处理方法,其特征在于,利用GC含量修正所述样本在每个所述特异性区域内的NRS值的步骤包括:利用修正公式NRSs'=NRSs×α修正所述样本在每个所述特异性区域内的NRSs值,其中,所述为所有特异性区域NRSs值的中位数值,NRSs”为利用所述样本的每个所述特异性区域的GC含量与NRSs值进行多项式样条拟合后获得的拟合值。3.根据权利要求2的处理方法,其特征在于,在利用所述样本的每个所述特异性区域的GC含量与NRSs值进行多项式样条拟合之前,所述处理方法还包括从所述样本的所有特异性区域中去除NRSs值异常的特异性区域的步骤,优选采用线性拟合或者局部多项式回归拟合的方法去除NRSs值异常的特异性区域。4.根据权利要求1的处理方法,其特征在于,所述NRSc值为10000~50000中的任意整数。5.根据权利要求1至4中任一项所述的处理方法,其特征在于,所述目标染色体选自以下任意一条或几条的组合:13号染色体、18号染色体、21号染色体、X染色体以及Y染色体;所述对照染色体选自以下任意一条或几条的组合:1号染色体、2号染色体、3号染色体、4号染色体、5号染色体、6号染色体、7号染色体、8号染色体、9号染色体、10号染色体、11号染色体以及12号染色体;优选地,所述对照染色体选自以下任意一条或几条的组合:1号染色体、2号染色体、3号染色体、6号染色体、7号染色体、11号染色体、12号染色体以及16号染色体。6.一种测序数据的处理装置,其特征在于,所述处理装置包括:测序模块,用于通过高通量测序获取来源于母体外周血样本的所有染色体的核苷酸序列信息;特异...
【专利技术属性】
技术研发人员:张必良,曹亮,
申请(专利权)人:广州市锐博生物科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。