一种关于拷贝数目重复变异的来源检测方法及装置制造方法及图纸

技术编号:39185601 阅读:7 留言:0更新日期:2023-10-27 08:33
本发明专利技术公开了一种关于拷贝数目重复变异的来源检测方法及装置,所述方法包括:在获取关于拷贝数目重复变异的变异数据以及获取变异数据对应的家系点突变数据后,确定家系点突变数据对应的上代突变类型以及确定变异数据对应的当代变异类型;根据上代突变类型和当代变异类型,计算变异数据占家系点突变数据的点突变密度分布比例值;基于点突变密度分布比例值确定变异数据的家系来源。本发明专利技术可以在获取拷贝数目重复变异的数据并确定与其相关的家系点突变数据,根据家系点突变数据的突变类型与重复变异数据突变类型,计算点突变数量的密度分布比例值,再基于密度分布比例值确定变异来源,进而贴合遗传原理,以提升检测的精度和准确率。准确率。准确率。

【技术实现步骤摘要】
一种关于拷贝数目重复变异的来源检测方法及装置


[0001]本专利技术涉及染色体检测
,尤其涉及一种关于拷贝数目重复变异的来源检测方法及装置。

技术介绍

[0002]随着科技的发展,基因检测技术已经日趋平常,其应用场景也日渐广泛。其中一种常见的关于异常基因的检测技术是关于拷贝数目重复变异来源的检测技术,其具体操作方式是扫描基因或全基因组以发现基因中重复变异的DNA序列,基于重复变异的DNA序列确定生物表型,将其生物表型与父本表型或母本表型进行匹配,以确定染色体中拷贝数目重复变异的来源。但表型与拷贝数目重复变异可能相关,也可能无关,表型的差异可能受到环境因素的影响,因此仅利用表型与父本表型或母本表型进行匹配,检测结果与实际结果相差较大,检测的精度较低。

技术实现思路

[0003]本专利技术提出一种关于拷贝数目变异的来源检测方法及装置,所述方法可以在获取拷贝数目重复变异的数据并确定与其相关的家系点突变数据,根据家系点突变数据与重复变异数据的密度分布比例确定变异来源,进而贴合遗传原理,以提升检测的精度和准确率。
[0004]本专利技术实施例的第一方面提供了一种关于拷贝数目重复变异的来源检测方法,所述方法包括:
[0005]在获取关于拷贝数目重复变异的变异数据以及获取所述变异数据对应的家系点突变数据后,确定所述家系点突变数据对应的上代突变类型以及确定所述变异数据对应的当代变异类型;
[0006]根据所述上代突变类型和所述当代变异类型,计算所述变异数据占所述家系点突变数据的点突变密度分布比例值;
[0007]基于所述点突变密度分布比例值确定所述变异数据的家系来源。
[0008]在第一方面的一种可能的实现方式中,所述点突变密度分布比例值包括:第一分布比例值;
[0009]所述根据所述上代突变类型和所述当代变异类型,计算所述变异数据占所述家系点突变数据的点突变密度分布比例值,包括:
[0010]若所述上代突变类型是父本为纯合突变且母本为野生突变,所述当代变异类型为杂合突变,则从所述变异数据中提取第一点突变比例数组;
[0011]利用预设的核密度估计函数将所述第一点突变比例数组转换成第一密度分布曲线,并利用预设的高斯分布核函数对所述第一密度分布曲线拟合,求得所述第一密度分布曲线最高点对应的分布比例值,得到第一分布比例值。
[0012]在第一方面的一种可能的实现方式中,所述点突变密度分布比例值还包括:第二分布比例值;
[0013]所述根据所述上代突变类型和所述当代变异类型,计算所述变异数据占所述家系点突变数据的点突变密度分布比例值,包括:
[0014]若所述上代突变类型是父本为野生突变且母本为纯合突变,所述当代变异类型为杂合突变,则从所述变异数据中提取第二点突变比例数组;
[0015]利用预设的核密度估计函数将所述第二点突变比例数组转换成第二密度分布曲线,并利用预设的高斯分布核函数对所述第二密度分布曲线拟合,求得所述第二密度分布曲线最高点对应的分布比例值,得到第二分布比例值。
[0016]在第一方面的一种可能的实现方式中,所述基于所述点突变密度分布比例值确定所述变异数据的来源,包括:
[0017]若所述第一分布比例值大于第一预设值且所述第二分布比例值小于第二预设值,则确定所述变异数据的家系来源为父本;
[0018]若所述第一分布比例值小于第二预设值且所述第二分布比例值大于第一预设值,则确定所述变异数据的家系来源为母本。
[0019]在第一方面的一种可能的实现方式中,所述基于所述点突变密度分布比例值确定所述变异数据的来源,还包括:
[0020]若所述第一分布比例值或所述第二分布比例值均不满足预设值,则不确定所述变异数据的家系来源。
[0021]在第一方面的一种可能的实现方式中,所述预设的核密度估计函数,如下式所述:
[0022][0023]所述预设的高斯分布核函数,如下式所述:
[0024][0025]在第一方面的一种可能的实现方式中,所述获取所述变异数据对应的家系点突变数据,包括:
[0026]获取所述变异数据对应的若干个家系测序原始数据,并对每个所述家系测序原始数据进行预处理,得到家系处理数据,所述预处理包括:数据清洗、数据质控、数据比对、变异检测和数据过滤,每个所述家系测序原始数据是所述变异数据对应的家系成员的基因数据;
[0027]将若干个所述家系处理数据包含的点突变数据合并,并提取合并数据的并集,得到点突变数据集合;
[0028]按照所述变异数据对应的变异片段对所述点突变数据集合进行数据筛选,得到家系点突变数据。
[0029]本专利技术实施例的第二方面提供了一种关于拷贝数目重复变异的来源检测装置,所述装置包括:
[0030]获取与确定模块,用于在获取关于拷贝数目重复变异的变异数据以及获取所述变异数据对应的家系点突变数据后,确定所述家系点突变数据对应的上代突变类型以及确定
所述变异数据对应的当代变异类型;
[0031]计算分布比例值模块,用于根据所述上代突变类型和所述当代变异类型,计算所述变异数据占所述家系点突变数据的点突变密度分布比例值;
[0032]确定家系来源模块,用于基于所述点突变密度分布比例值确定所述变异数据的家系来源。
[0033]相比于现有技术,本专利技术实施例提供的一种关于拷贝数目重复变异的来源检测方法及装置,其有益效果在于:本专利技术可以在获取拷贝数目重复变异的数据并确定与其相关的家系点突变数据,根据家系点突变数据的突变类型与重复变异数据突变类型,计算点突变数量的密度分布比例值,再基于密度分布比例值确定变异来源,进而贴合遗传原理,以提升检测的精度和准确率。
附图说明
[0034]图1是本专利技术一实施例提供的一种关于拷贝数目重复变异的来源检测方法的流程示意图;
[0035]图2是本专利技术一实施例提供的一种关于拷贝数目重复变异的来源检测方法的操作流程图;
[0036]图3是本专利技术一实施例提供的拷贝数结果的示意图;
[0037]图4是本专利技术一实施例提供的三拷贝情况下两种组合对应的先证者点突变突变比例密度分布图;
[0038]图5是本专利技术一实施例提供的一种关于拷贝数目重复变异的来源检测装置的结构示意图。
具体实施方式
[0039]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0040]为了解决上述问题,下面将通过以下具体的实施例对本申请实施例提供的一种关于拷贝数目重复变异的来源检测方法进行详细介绍和说明。
[0041]参照图1,示出了本专利技术一实施例提供的一种关于拷贝数目重复变异的来源检测方法的流程示意图。
[0042]在一实施例中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关于拷贝数目重复变异的来源检测方法,其特征在于,所述方法包括:在获取关于拷贝数目重复变异的变异数据以及获取所述变异数据对应的家系点突变数据后,确定所述家系点突变数据对应的上代突变类型以及确定所述变异数据对应的当代变异类型;根据所述上代突变类型和所述当代变异类型,计算所述变异数据占所述家系点突变数据的点突变密度分布比例值;基于所述点突变密度分布比例值确定所述变异数据的家系来源。2.根据权利要求1所述的关于拷贝数目重复变异的来源检测方法,其特征在于,所述点突变密度分布比例值包括:第一分布比例值;所述根据所述上代突变类型和所述当代变异类型,计算所述变异数据占所述家系点突变数据的点突变密度分布比例值,包括:若所述上代突变类型是父本为纯合突变且母本为野生突变,所述当代变异类型为杂合突变,则从所述变异数据中提取第一点突变比例数组;利用预设的核密度估计函数将所述第一点突变比例数组转换成第一密度分布曲线,并利用预设的高斯分布核函数对所述第一密度分布曲线拟合,求得所述第一密度分布曲线最高点对应的分布比例值,得到第一分布比例值。3.根据权利要求2所述的关于拷贝数目重复变异的来源检测方法,其特征在于,所述点突变密度分布比例值还包括:第二分布比例值;所述根据所述上代突变类型和所述当代变异类型,计算所述变异数据占所述家系点突变数据的点突变密度分布比例值,包括:若所述上代突变类型是父本为野生突变且母本为纯合突变,所述当代变异类型为杂合突变,则从所述变异数据中提取第二点突变比例数组;利用预设的核密度估计函数将所述第二点突变比例数组转换成第二密度分布曲线,并利用预设的高斯分布核函数对所述第二密度分布曲线拟合,求得所述第二密度分布曲线最高点对应的分布比例值,得到第二分布比例值。4.根据权利要求3所述的关于拷贝数目重复变异的来源检测方法,其特征在于,所述基于所述点突变密度分布比例值确定所述变异数据的来源,包括:若所述第一分布比例值大于第一预设值且所述第二分布比例值小于第二预设值,则确定所述变异数据的家系来源为父本;若所述第一分布比例值小于第二预设值且所述第二分布比例值大于第一预设值,则确定所述变异数据的家系来源为母本。5.根据权利要求4所述...

【专利技术属性】
技术研发人员:何杰窦浩宇刘永初燕攀刘阳李阳
申请(专利权)人:深圳安吉康尔医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1