基因数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:34007511 阅读:13 留言:0更新日期:2022-07-02 13:45
本申请涉及一种基因数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待处理基因数据;对所述待处理基因数据进行提取,得到所述获取待处理基因数据的纯合突变位点的信息;获取预先设置的筛选条件,根据所述筛选条件以及所述纯合突变位点的信息在所述待处理基因数据中筛选疑似污染位点;根据所述疑似污染位点计算所述待处理基因数据的污染率。采用本方法能够准确计算污染率,提高检测结果的可靠性。提高检测结果的可靠性。提高检测结果的可靠性。

【技术实现步骤摘要】
基因数据处理方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种数据处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]在对肿瘤DNA样本高通量测序时,常常会因为各种原因导致样本被污染,例如切片过程中蜡块之间未清理刀片/毛刷/切片机、摊片机样本残留、病人有过输血或者器官移植以及实验人员操作失误等导致样本污染,这会直接导致检测结果不可靠。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够准确计算污染率,提高检测结果的可靠性的基因数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0004]第一方面,本申请提供了一种基因数据处理方法,该方法包括:
[0005]获取待处理基因数据;
[0006]对待处理基因数据进行提取,得到获取待处理基因数据的纯合突变位点的信息;
[0007]获取预先设置的筛选条件,根据筛选条件以及纯合突变位点的信息在待处理基因数据中筛选疑似污染位点;
[0008]根据疑似污染位点计算待处理基因数据的污染率。
[0009]在其中一个实施例中,上述根据筛选条件以及纯合突变位点的信息在待处理基因数据中筛选疑似污染位点包括:
[0010]根据筛选条件确定待处理基因数据中每一变异基因的类型;
[0011]根据变异基因的类型以及纯合突变位点的信息进行筛选,得到待处理基因数据中的每一变异基因的疑似污染位点。
[0012]在其中一个实施例中,上述根据疑似污染位点计算待处理基因数据的污染率之前,还包括:
[0013]对疑似污染位点进行过滤,选择差异大于预设阈值的每一个变异基因的疑似污染位点作为每一个变异基因的污染位点。
[0014]在其中一个实施例中,上述根据疑似污染位点计算待处理基因数据的污染率,包括:
[0015]根据每一变异基因的污染位点计算每一变异基因的污染率;
[0016]根据每一变异基因的污染率得到待处理基因数据的污染率。
[0017]在其中一个实施例中,上述获取待处理基因数据,包括:
[0018]获取待检测基因数据,对待检测基因数据进行格式转换,得到格式转换后的待检测基因数据;
[0019]对格式转换后的待检测基因数据进行去重,得到待处理基因数据。
[0020]在其中一个实施例中,上述对待处理基因数据进行提取,得到获取待处理基因数据的纯合突变位点的信息,包括:
[0021]当待处理基因数据包括对照组数据时,对对照组数据进行提取,得到待处理基因数据的纯合突变位点的信息。
[0022]在其中一个实施例中,上述对待处理基因数据进行提取,得到获取待处理基因数据的纯合突变位点的信息,还包括:
[0023]当待处理基因数据不包括对照组数据时,获取与待处理基因数据对应的预设基因数据库;
[0024]对预设基因数据库进行计算,得到待处理基因数据的纯合突变位点的信息。
[0025]第二方面,本申请还提供了一种基因数据处理装置,该装置包括:
[0026]数据获取模块,用于获取待处理基因数据;
[0027]位点获取模块,用于对待处理基因数据进行提取,得到获取待处理基因数据的纯合突变位点的信息;
[0028]筛选模块,用于获取预先设置的筛选条件,根据筛选条件在待处理基因数据中筛选疑似污染位点;
[0029]污染率计算模块,用于根据疑似污染位点计算待处理基因数据的污染率。
[0030]第三方面,本申请还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任意一个实施例中的方法的步骤。
[0031]第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。
[0032]第五方面,本申请还提供了一种计算机程序产品,该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。
[0033]上述基因数据处理方法、装置、计算机设备、存储介质和计算机程序产品,首先获取待处理基因数据,然后对待处理基因数据进行提取,以得到待处理基因数据的纯合突变位点的信息,然后根据预先设置的筛选条件将一些不可能存在污染的位点进行过滤掉,并根据纯合突变位点的信息来确定待处理基因数据中的疑似污染位点,最后根据这些疑似污染位点进行计算,以准确获得待处理基因数据中污染率。其次,在本实施例中可以在不用额外的湿实验环节,仅依靠干试验既可准确的鉴别并量化待处理基因数据污染水平,具有高灵敏性和高特异性。
附图说明
[0034]图1为一个实施例中基因数据处理方法的应用环境图;
[0035]图2为一个实施例中基因数据处理方法的流程示意图;
[0036]图3为一个实施例中不同产品类型样本污染水平检测箱型图;
[0037]图4为一个实施例中模拟污染率验证可靠性的示意图;
[0038]图5为一个实施例中基因数据处理流程示意图;
[0039]图6为一个实施例中基因数据处理装置的结构框图;
[0040]图7为一个实施例中计算机设备的内部结构图。
具体实施方式
[0041]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0042]本申请实施例提供的基因数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104获取待处理基因数据,对待处理基因数据进行提取,得到待处理基因数据的纯合突变位点信息;获取预先设置的筛选条件,根据筛选条件以及纯合突变位点信息在待处理基因数据中筛选出疑似污染位点,最后根据疑似污染位点计算待处理基因数据的污染率,这样能够准确计算污染率,提高检测结果的可靠性。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0043]在一个实施例中,如图2所示,提供了一种基因数据处理方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
[0044]S202,获取待处理基因数据。
[0045]其中,待处理基因数据是指需要进行污染检测的携带基因的任意数据,例如血液样本对应的基因检测后的数据,肿瘤样本对应的基因检测后的数据等。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基因数据处理方法,其特征在于,所述方法包括:获取待处理基因数据;对所述待处理基因数据进行提取,得到所述获取待处理基因数据的纯合突变位点的信息;获取预先设置的筛选条件,根据所述筛选条件以及所述纯合突变位点的信息在所述待处理基因数据中筛选疑似污染位点;根据所述疑似污染位点计算所述待处理基因数据的污染率。2.根据权利要求1所述的方法,其特征在于,所述根据所述筛选条件以及所述纯合突变位点的信息在所述待处理基因数据中筛选疑似污染位点,包括:根据所述筛选条件确定所述待处理基因数据中每一变异基因的类型;根据所述变异基因的类型以及所述纯合突变位点的信息进行筛选,得到所述待处理基因数据中的每一所述变异基因的疑似污染位点。3.根据权利要求1所述的方法,其特征在于,所述根据所述疑似污染位点计算所述待处理基因数据的污染率之前,还包括:对所述疑似污染位点进行过滤,选择差异大于预设阈值的每一个所述变异基因的所述疑似污染位点作为每一个所述变异基因的污染位点。4.根据权利要求1所述的方法,其特征在于,所述根据所述疑似污染位点计算所述待处理基因数据的污染率,包括:根据每一所述变异基因的污染位点计算每一所述变异基因的污染率;根据每一所述变异基因的污染率得到所述待处理基因数据的污染率。5.根据权利要求1所述的方法,其特征在于,所述获取待处理基因数据,包括:获取待检测基因数据,对所述待检测基因数据进行格式转换,得到格式转换后的所述待检测基因数据;对所述格式转换后的所述待检测基因数据进行去重,得到所述待处理基因数据。6.根据权...

【专利技术属性】
技术研发人员:董筱微张恒柳文进
申请(专利权)人:上海至本医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1