【技术实现步骤摘要】
基因检测方法、模型训练方法、装置、设备及系统
[0001]本专利技术涉及基因处理
,尤其涉及一种基因检测方法、模型训练方法、装置、设备及系统。
技术介绍
[0002]基因测序是一种新型的基因检测技术,能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性、个体的行为特征及行为合理。基因测序技术能锁定个人病变基因,以便于基于个人病变基因提前进行预防和治疗。
[0003]其中,基因序列由大量的reads片段组成,reads片段是指一段特定长度的DNA片段,上述的特定长度取决于测序仪的读长,每一条read片段中的信息可以包括:碱基序列、质量序列、正负链等等,上述的碱基序列和质量序列一一对应。对于人类而言,Reads片段覆盖了23对染色体,共计超过30亿的碱基对。
[0004]一般对于人来说,做一次全基因组测序需要几万块钱,虽然近年来随着测序技术的持续发展,基因测序的费用有了一定的降低,但是还是一笔不小的开支。因此,如何降低基因检测的成本是一个亟需解决的问题。
技术实现思路
[0005] ...
【技术保护点】
【技术特征摘要】
1.一种基因检测方法,其特征在于,包括:获取待处理基因数据,其中,所述待处理基因数据中每个位置所对应基因片段的平均数量小于或等于预设阈值;将所述待处理基因数据输入至特征生成网络层进行特征提取操作,获得与所述待处理基因数据相对应的基因特征和与所述基因特征相对应的增强后特征;将所述待处理基因数据和所述增强后特征输入至基因识别网络层进行基因检测操作,获得检测结果。2.根据权利要求1所述的方法,其特征在于,将所述待处理基因数据和所述增强后特征输入至基因识别网络层进行基因检测操作,获得检测结果,包括:利用所述基因识别网络层对所述待处理基因数据和所述增强后特征进行基因检测处理,获得与所述待处理基因数据相对应的检测参考信息,所述检测参考信息包括以下至少之一:21类基因型预测信息、合子性预测信息、第一条等位基因变异长度信息以及第二条等位基因变异长度信息;根据所述检测参考信息,获得与所述待处理基因数据相对应的检测结果。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取与所述待处理基因数据相对应的标准数据类型;将所述基因特征输入至数据识别网络层进行数据类型识别操作,获得基因数据类型;基于所述基因数据类型和标准数据类型,确定用于对所述特征生成网络层的损失函数;利用所述损失函数对所述特征生成网络层进行优化,获得优化后的特征生成网络层。4.根据权利要求3所述的方法,其特征在于,所述特征生成网络层包括数据识别网络层的一部分;利用所述损失函数对所述特征生成网络层进行优化,获得优化后的特征生成网络层,包括:基于所述损失函数对所述数据识别网络层进行优化处理,获得优化后的数据识别网络层;基于优化后的数据识别网络层,确定优化后的特征生成网络层。5.一种模型训练方法,其特征在于,包括:获取基因样本,所述基因样本对应有样本变异结果,所述基因样本中每个位置所对应基因片段的平均数量小于或等于预设阈值;确定与所述基因样本相对应的基因特征和与所述基因特征相对应的增强后特征;基于所述基因样本对应的参考基因结果、基因特征和增强后特征进行学习训练,获得基因检测模型,所述基因检测模型用于对基因数据进行特征提取操作,并基于所提取的特征对基因数据进行检测操作。6.根据权利要求5所述的方法,其特征在于,基于所述基因样本对应的参考基因结果、基因特征和增强后特征进行学习训练,获得基因检测模型,包括:基于所述基因样本、基因特征和增强后特征进行学习训练,获得特征生成子模型,所述特征生成子模型用于进行特征提取,并对提取后的基因特征进行增强处理;基于所述增强后特征和所述基因样本对应的参考基因结果进行学习训练,获得变异识别子模型,所述变异识别子模型用于基于特征信息对基因数据进行检测操作;
基于所述特征生成子模型和所述变异识别子模型,生成所述基因检测模型。7.根据权利要求6所述的方法,其特征在于,在获得特征生成子模型之后,所述方法还包括:基于所述基因特征和所述基因样本所对应的参考基因...
【专利技术属性】
技术研发人员:杨晗,顾斐,
申请(专利权)人:阿里巴巴新加坡控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。