基因测序数据处理方法技术

技术编号:39741303 阅读:8 留言:0更新日期:2023-12-17 23:42
本申请提供了一种基因测序数据处理方法

【技术实现步骤摘要】
基因测序数据处理方法、装置、设备及存储介质


[0001]本专利技术涉及基因数据处理
,具体而言,涉及一种基因测序数据处理方法

装置

设备及存储介质


技术介绍

[0002]利用高通量测序技术在肿瘤早筛

精准用药以及遗传病检测领域扮演着重要角色

随着二代测序通量的提升,单个批次数据包含的样本数目越来越多,特别是以小面板数据为主的实验室,为了保证每个数据与原始样本正确对应,各实验室在操作过程中都设立严格的标准

但是从样本进入实验室到数据产出,这期间几乎是一个黑匣子,样本与数据的唯一关联就是样本编号

[0003]为了实现样本与数据之间对应关系的质控,以往的
NGS
数据判定性别使用的是全外显子
(WES)
或全基因组
(WGS)
数据,由于成本原因,不适合肿瘤临床使用

目前现有技术,虽然将范围缩小到了性染色体
Y
上,但是其片段大小依然有
23Mb
,而当前临床诊断使用的常见面板
(panel)
数据大小范围是1‑
5Mb
,因为性别质控,额外增加原有数据量4倍以上的数据不现实,而且运算成本也同样会成倍增加,因此,现有技术与临床实际低成本

短周期

高质量的需求不符


技术实现思路

[0004]本专利技术的目的在于,针对上述现有技术中的不足,提供一种基因测序数据处理方法

装置

设备及存储介质,以便实现对预设生物组织样本对应的性别类别的准确判定,并提高判定效率

[0005]为实现上述目的,本申请实施例采用的技术方案如下:
[0006]第一方面,本申请实施例提供了一种基因测序数据处理方法,包括:
[0007]获取预设生物组织样本的基因测序数据;
[0008]根据预设的基因区段,从所述基因测序数据中提取覆盖所述基因区段内的多个性别基因相关的目标片段的测序数据;
[0009]根据所述多个性别基因相关的目标片段的测序数据,计算多个目标片段的平均测序深度;
[0010]根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别

[0011]在可选的实施方式中,所述根据所述多个性别基因相关的目标片段的测序数据,计算多个目标片段的平均测序深度,包括:
[0012]根据每个性别基因相关的目标片段,以及所述基因测序数据,计算各个目标片段的平均测序深度

[0013]在可选的实施方式中,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,
包括:
[0014]确定所述多个目标片段的平均测序深度是否大于预设最低平均测序深度;
[0015]若所述多个目标片段的平均测序深度均小于或等于所述预设最低平均测序深度,则确定所述预设生物组织样本对应的性别类别为未知性别

[0016]在可选的实施方式中,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,还包括:
[0017]若所述多个目标片段的平均测序深度均大于所述预设最低平均测序深度,则确定所述多个目标片段中第一性别基因相关片段的平均测序深度是否大于或等于预设参考平均测序深度;
[0018]若所述第一性别基因相关片段的平均测序深度大于或等于所述预设参考平均测序深度,则确定所述预设生物组织样本对应的性别类别为第一已知性别

[0019]在可选的实施方式中,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,还包括:
[0021]若所述第一性别基因相关片段的平均测序深度小于所述预设参考平均测序深度,确定所述第一性别基因相关片段的平均测序深度和第二性别基因相关片段的平均测序深度的比值;
[0022]确定所述比值是否大于或等于第一预设比值;
[0023]若所述比值大于或等于所述第一预设比值,则确定所述预设生物组织样本对应的性别类别为第一已知性别

[0024]在可选的实施方式中,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,还包括:
[0025]若所述比值小于所述第一预设比值,则确定所述比值是否小于第二预设比值,所述第二预设比值小于所述第一预设比值;
[0026]若所述比值小于所述第二预设比值,则确定所述预设生物组织样本对应的性别类别为第二已知性别

[0027]在可选的实施方式中,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,还包括:
[0028]若所述比值大于或等于所述第二预设比值,则确定所述预设生物组织样本对应的性别类别为未知性别

[0029]第二方面,本申请实施例还提供了一种基因测序数据处理装置,包括:
[0030]获取模块,用于获取预设生物组织样本的基因测序数据;
[0031]提取模块,用于根据预设的基因区段,从所述基因测序数据中提取覆盖所述基因区段内的多个性别基因相关的目标片段的测序数据;
[0032]计算模块,用于根据所述多个性别基因相关的目标片段的测序数据,计算多个目标片段的平均测序深度;
[0033]确定模块,用于根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别

[0034]第三方面,本申请实施例还提供了一种计算机设备,包括:处理器

存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当计算机设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行如第一方面任一所述的基因测序数据处理方法的步骤

[0035]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面任一所述的基因测序数据处理方法的步骤

[0036]本申请的有益效果是:
[0037]本申请实施例提供了一种基因测序数据处理方法
...

【技术保护点】

【技术特征摘要】
1.
一种基因测序数据处理方法,其特征在于,包括:获取预设生物组织样本的基因测序数据;根据预设的基因区段,从所述基因测序数据中提取覆盖所述基因区段内的多个性别基因相关的目标片段的测序数据;根据所述多个性别基因相关的目标片段的测序数据,计算多个目标片段的平均测序深度;根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别
。2.
如权利要求1所述的方法,其特征在于,所述根据所述多个性别基因相关的目标片段的测序数据,计算多个目标片段的平均测序深度,包括:根据每个性别基因相关的目标片段,以及所述基因测序数据,计算各个目标片段的平均测序深度
。3.
如权利要求1所述的方法,其特征在于,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,包括:确定所述多个目标片段的平均测序深度是否大于预设最低平均测序深度;若所述多个目标片段的平均测序深度均小于或等于所述预设最低平均测序深度,则确定所述预设生物组织样本对应的性别类别为未知性别
。4.
如权利要求3所述的方法,其特征在于,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,还包括:若所述多个目标片段的平均测序深度均大于所述预设最低平均测序深度,则确定所述多个目标片段中第一性别基因相关片段的平均测序深度是否大于或等于预设参考平均测序深度;若所述第一性别基因相关片段的平均测序深度大于或等于所述预设参考平均测序深度,则确定所述预设生物组织样本对应的性别类别为第一已知性别
。5.
如权利要求4所述的方法,其特征在于,所述根据所述多个目标片段的平均测序深度

以及所述多个目标片段的平均测序深度之间的相关性,确定所述预设生物组织样本对应的性别类别,还包括:若所述第一性别基因相关片段的平均测序深度小于所述预设参考平均测序深度,确定所述第一性别基因相关片段的平均测序深度和第二性...

【专利技术属性】
技术研发人员:封彦杰张美俊李致伟赵玥孙雪王伟伟田埂
申请(专利权)人:北京元码医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1