基因检测方法、特征提取方法、装置、设备及系统制造方法及图纸

技术编号:30408859 阅读:21 留言:0更新日期:2021-10-20 11:22
本发明专利技术实施例提供了一种基因检测方法、特征提取方法、装置、设备及系统。基因检测方法包括:获取待处理的基因序列,基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;对基因序列进行特征提取操作,获得基因特征;对基因特征进行增强处理,获得与基因特征相对应的增强后特征;基于增强后特征对基因序列进行检测,获得检测结果。本实施例提供的技术方案,通过对基因序列进行特征提取操作,获得基因特征,而后对基因特征进行增强处理,获得增强后特征,之后基于增强后特征对基因序列进行检测,获得检测结果,这样不仅保证了基因检测操作的精确度,并且还有效地降低了数据处理成本和数据处理量。处理成本和数据处理量。处理成本和数据处理量。

【技术实现步骤摘要】
基因检测方法、特征提取方法、装置、设备及系统


[0001]本专利技术涉及基因检测
,尤其涉及一种基因检测方法、特征提取方法、装置、设备及系统。

技术介绍

[0002]基因测序是一种新型的基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性、个体的行为特征及行为合理。基因测序技术能锁定个人病变基因,以便于基于个人病变基因提前进行预防和治疗。
[0003]其中,基因序列由大量的reads片段组成,reads片段是指一段特定长度的DNA片段,上述的特定长度取决于测序仪的读长,每一条read片段中的信息可以包括:碱基序列、质量序列、正负链等等,上述的碱基序列和质量序列一一对应。对于人类而言,Reads片段覆盖了23对染色体,共计超过30亿的碱基对。
[0004]一般对于人来说,做一次全基因组测序需要几万块钱,虽然近年来随着测序技术的持续发展,基因测序的费用有了一定的降低,但是还是一笔不小的开支。因此,如何降低基因检测的成本是一个亟需解决的问题。

技术实现思路

[0005]本专利技术实施例提供了一种基因检测方法、特征提取方法、装置、设备及系统,通过对低深度的基因序列进行特征提取,获得低深度的基因特征,而后对基因特征进行增强处理,并基于增强后特征来进行检测操作,从而不仅保证了基因检测操作的精确度,并且还有效地降低了数据处理成本和数据处理量。
[0006]第一方面,本专利技术实施例提供一种基因检测方法,包括:
[0007]获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;
[0008]对所述基因序列进行特征提取操作,获得基因特征;
[0009]对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征;
[0010]基于所述增强后特征对所述基因序列进行检测,获得检测结果。
[0011]第二方面,本专利技术实施例提供一种基因检测装置,包括:
[0012]第一获取模块,用于获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;
[0013]第一提取模块,用于对所述基因序列进行特征提取操作,获得基因特征;
[0014]第一处理模块,用于对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征;
[0015]第一检测模块,用于基于所述增强后特征对所述基因序列进行检测,获得检测结果。
[0016]第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存
储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的基因检测方法。
[0017]第四方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第一方面中的基因检测方法。
[0018]第五方面,本专利技术实施例提供了一种特征提取方法,包括:
[0019]获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;
[0020]对所述基因序列进行特征提取操作,获得基因特征;
[0021]对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征,所述增强后特征包括的信息量大于所述基因特征包括的信息量。
[0022]第六方面,本专利技术实施例提供了一种特征提取装置,包括:
[0023]第二获取模块,用于获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;
[0024]第二提取模块,用于对所述基因序列进行特征提取操作,获得基因特征;
[0025]第二处理模块,用于对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征,所述增强后特征包括的信息量大于所述基因特征包括的信息量。
[0026]第七方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第五方面中的特征提取方法。
[0027]第八方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第五方面中的特征提取方法。
[0028]第九方面,本专利技术实施例提供了一种基因检测方法,包括:
[0029]响应于调用基因检测请求,确定基因检测服务对应的处理资源;
[0030]利用所述处理资源执行如下步骤:获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;对所述基因序列进行特征提取操作,获得基因特征;对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征;基于所述增强后特征对所述基因序列进行检测,获得检测结果。
[0031]第十方面,本专利技术实施例提供了一种基因检测装置,包括:
[0032]第三获取模块,用于响应于调用基因检测请求,确定基因检测服务对应的处理资源;
[0033]第三处理模块,用于利用所述处理资源执行如下步骤:获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;对所述基因序列进行特征提取操作,获得基因特征;对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征;基于所述增强后特征对所述基因序列进行检测,获得检测结果。
[0034]第十一方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第九方面中的基因检测方法。
[0035]第十二方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第九方面中的基因检测方法。
[0036]第十三方面,本专利技术实施例提供了一种特征提取方法,包括:
[0037]响应于调用特征提取请求,确定特征提取服务对应的处理资源;
[0038]利用所述处理资源执行如下步骤:获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;对所述基因序列进行特征提取操作,获得基因特征;对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征,所述增强后特征包括的信息量大于所述基因特征包括的信息量。
[0039]第十四方面,本专利技术实施例提供了一种特征提取装置,包括:
[0040]第四获取模块,用于响应于调用特征提取请求,确定特征提取服务对应的处理资源;
[0041]第四处理模块,用于利用所述处理资源执行如下步骤:获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;对所述基因序列进行特征提取操作,获得基因特征;对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征,所述增强后特征包括的信息量大于所述基因特征包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基因检测方法,其特征在于,包括:获取待处理的基因序列,所述基因序列中每个位置所对应基因片段的平均数量小于或等于预设阈值;对所述基因序列进行特征提取操作,获得基因特征;对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征;基于所述增强后特征对所述基因序列进行检测,获得检测结果。2.根据权利要求1所述的方法,其特征在于,对所述基因序列进行特征提取操作,获得基因特征,包括:确定与所述基因序列相对应的待分析基因片段;对所述待分析基因片段进行特征提取操作,获得基因特征。3.根据权利要求2所述的方法,其特征在于,确定与所述基因序列相对应的待分析基因片段,包括:获取参考数据和所述基因序列中包括的多个初始基因片段;对所述参考数据和基因序列进行匹配,以在所述多个初始基因片段中确定待分析基因片段,所述待分析基因片段中存在与参考数据不匹配的碱基,且不匹配的碱基在所述待分析基因片段中的占比大于预设阈值。4.根据权利要求2所述的方法,其特征在于,对所述待分析基因片段进行特征提取操作,获得基因特征,包括:获取所述待分析基因片段中所包括的碱基质量;基于所述碱基质量,确定与所述待分析基因片段相对应的置信度;基于所述待分析基因片段所对应的置信度对所述待分析基因片段进行特征提取操作,获得所述基因特征。5.根据权利要求1所述的方法,其特征在于,对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征,包括:获取用于对所述基因特征进行增强处理的卷积神经网络模型;基于所述卷积神经网络模型对所述基因特征进行增强处理,获得与所述基因特征相对应的增强后特征。6.根据权利要求1

5中任意一项所述的方法,其特征在于,所述增强后特征包括的信息量大于所述基因特征包括的信息量。7.根据权利要求1

5中任意一项所述的方法,其特征在于,所述增强后特征的数据尺寸与所述基因特征的数据尺寸相同。8.根据权利要求1

5中任意一项所述的方法,其特征在于,基于所述增强后特征对所述基因序列进行检测,获得检测结果,包括:基于所述增强后特征,获取与所述增强后特征相对应的变异参考信息,所述变异参考信息包括以下至少之一:21类基因型预测信息、合子性预测信息、第一条等位基因变异长度信息以及第二条等位基因变异长度信息;根据所述变异参考信息,获得变异检测结果。9.根据权利要求1

5中任意一项所述...

【专利技术属性】
技术研发人员:杨晗顾斐
申请(专利权)人:阿里巴巴新加坡控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1