数据预测方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:33351879 阅读:83 留言:0更新日期:2022-05-08 09:59
本公开提供了一种数据预测方法、装置、电子设备以及计算机可读存储介质,其中,首先获取目标微生物的初始基因信息;之后,基于所述初始基因信息,确定所述目标微生物的预设遗传信息载体对应的基因序列信息;之后,确定所述基因序列信息对应的基因统计特征;其中,所述基因统计特征包括所述预设遗传信息载体对应的至少一个基因片段,以及每个所述基因片段对应的频率信息;最后,基于所述基因统计特征和所述基因序列信息,确定所述目标微生物的类别信息。信息。信息。

【技术实现步骤摘要】
数据预测方法、装置、电子设备以及存储介质


[0001]本公开涉及微生物
,具体而言,涉及一种数据预测方法、装置、电子设备以及存储介质。

技术介绍

[0002]人类肠道微生物,例如人类肠道菌群与人类健康和疾病具有直接的联系,因此,对微生物进行基因解析、识别微生物的种类、以及建立微生物的种类与疾病的关联关系对于疾病的诊断具有重要的作用。
[0003]目前对微生物的种类进行预测的方案中存在精度低的缺陷,例如有些方案是基于基因特征相互独立的假设来进行种类预测的,但是这种假设有时是不成立的,因此造成对微生物的种类预测精度不高的缺陷。

技术实现思路

[0004]本公开实施例至少提供一种数据预测方法、装置、电子设备以及计算机可读存储介质。
[0005]第一方面,本公开实施例提供了一种数据预测方法,包括:
[0006]获取目标微生物的初始基因信息;
[0007]基于所述初始基因信息,确定所述目标微生物的预设遗传信息载体对应的基因序列信息;
[0008]确定所述基因序列信息对应的基因统计特征;其中,所述基因统计特征包括所述预设遗传信息载体对应的至少一个基因片段,以及每个所述基因片段对应的频率信息;
[0009]基于所述基因统计特征和所述基因序列信息,确定所述目标微生物的类别信息。
[0010]该方面,在对目标微生物进行种类预测的过程中,不是基于基因特征相互独立的假设,而是综合利用预设遗传信息载体对应的基因序列信息以及基因序列信息对应的基因统计特征来进行,两种信息的综合利用能够有效提高目标微生物种类预测的精度;另外,预设遗传信息载体对应的基因序列信息包括较少的能够表征目标微生物类别的基因信息,基因统计特征作为上述基因序列信息的统计特征,能够较为准确的表征目标微生物的基因信息,因此,利用基因统计特征来对目标微生物的种类进行预测,能够保证预测精度;另外,在对目标微生物进行种类预测的过程中,不是利用所有的基因数据,而是利用上述基因序列信息对应的基因统计特征,这就有效减少了在种类预测中所使用的数据量,提高了预测效率,节省了计算资源。
[0011]在一种可能的实施方式中,所述基于所述基因统计特征和所述基因序列信息,确定所述目标微生物的类别信息,包括:
[0012]对所述基因统计特征进行特征提取,得到第一目标特征;
[0013]对所述基因序列信息进行特征提取,得到第二目标特征;
[0014]基于所述第一目标特征和所述第二目标特征,确定所述目标微生物的类别信息。
[0015]该实施方式,对基因统计特征和基因序列信息进行进一步地特征提取,提取得到的特征能够更加明确地表征目标微生物的种类信息,因此,利用提取得到的特征,即上述第一目标特征和第二目标特征能够较为准确地确定目标微生物的类别信息;同时,对基因统计特征和基因序列信息进行进一步地特征提取,能够减少后续处理步骤中需要处理的数据量,在提高处理效率的同时,节省了计算资源。
[0016]在一种可能的实施方式中,所述基于所述第一目标特征和所述第二目标特征,确定所述目标微生物的类别信息,包括:
[0017]对所述第一目标特征和所述第二目标特征进行特征融合,得到目标融合特征;
[0018]基于所述目标融合特征,确定所述目标微生物的类别信息。
[0019]该实施方式,对提取出的能够明确地表征目标微生物的种类信息的第一目标特征和所述第二目标特征进行特征融合,得到的目标融合特征能够更加深层次的表征目标微生物的种类信息,在此基础上,利用目标融合特征进行种类预测,能够有效提高确定的目标微生物的类别信息的准确度。
[0020]在一种可能的实施方式中,所述对所述第一目标特征和所述第二目标特征进行特征融合,得到目标融合特征,包括:
[0021]将所述第一目标特征和所述第二目标特征进行加和处理,得到第一融合子信息;
[0022]将所述第一目标特征和所述第二目标特征进行点乘处理,得到第二融合子信息;
[0023]将所述第一融合子信息和所述第二融合子信息进行加和处理,得到所述目标融合特征。
[0024]该实施方式,通过对第一目标特征和所述第二目标特征进行加和处理和点乘处理,以及对加和处理得到的第一融合子信息和点乘处理得到的第二融合子信息进一步进行加和处理,能够充分挖掘第一目标特征和所述第二目标特征中能够表征目标微生物的种类信息的特征,得到能够更加深层次的表征目标微生物的种类信息的目标融合特征。
[0025]在一种可能的实施方式中,所述基于所述目标融合特征,确定所述目标微生物的类别信息,包括:
[0026]将所述目标融合特征输入训练好的深度学习网络,经过所述深度学习网络对所述目标融合特征进行处理,得到所述目标微生物的类别信息。
[0027]该实施方式,利用训练好的深度学习网络对目标融合特征进行处理以对目标微生物进行种类预测,能够进一步提高种类预测效率以及节省人力资源。
[0028]在一种可能的实施方式中,所述基因片段包括多个碱基组成的碱基序列。
[0029]该实施方式,多个碱基组成的碱基序列能够表征一个基因片段的基因特征,进一步地,多个基因片段以及每个基因片段的频率信息能够较为准确地表征目标微生物的基因特征,因此,利用由基因片段确定的基因统计特征来进行目标微生物的种类预测,能够有效提高预测精度。
[0030]在一种可能的实施方式中,所述目标微生物包括细菌,所述类别信息包括所述细菌所属的属对应的第一类别信息和/或所述细菌所属的种对应的第二类别信息。
[0031]该实施方式,种或属能够准确表征细菌的类别信息。
[0032]在一种可能的实施方式中,所述预设遗传信息载体包括核糖体核糖核酸;所述基因序列信息包括所述核糖体核糖核酸对应的碱基序列。
[0033]该实施方式,核糖体核糖核酸分子大小适中,突变率小,利用核糖体核糖核酸能够较为准确地对目标微生物进行种类预测。
[0034]第二方面,本公开提供了一种数据预测装置,包括:
[0035]信息获取模块,用于获取目标微生物的初始基因信息;
[0036]信息处理模块,用于基于所述初始基因信息,确定所述目标微生物的预设遗传信息载体对应的基因序列信息;
[0037]特征提取模块,用于确定所述基因序列信息对应的基因统计特征;其中,所述基因统计特征包括所述预设遗传信息载体对应的至少一个基因片段,以及每个所述基因片段对应的频率信息;
[0038]类别检测模块,用于基于所述基因统计特征和所述基因序列信息,确定所述目标微生物的类别信息。
[0039]第三方面,本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
[0040]第四方面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据预测方法,其特征在于,包括:获取目标微生物的初始基因信息;基于所述初始基因信息,确定所述目标微生物的预设遗传信息载体对应的基因序列信息;确定所述基因序列信息对应的基因统计特征;其中,所述基因统计特征包括所述预设遗传信息载体对应的至少一个基因片段,以及每个所述基因片段对应的频率信息;基于所述基因统计特征和所述基因序列信息,确定所述目标微生物的类别信息。2.根据权利要求1所述的方法,其特征在于,所述基于所述基因统计特征和所述基因序列信息,确定所述目标微生物的类别信息,包括:对所述基因统计特征进行特征提取,得到第一目标特征;对所述基因序列信息进行特征提取,得到第二目标特征;基于所述第一目标特征和所述第二目标特征,确定所述目标微生物的类别信息。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一目标特征和所述第二目标特征,确定所述目标微生物的类别信息,包括:对所述第一目标特征和所述第二目标特征进行特征融合,得到目标融合特征;基于所述目标融合特征,确定所述目标微生物的类别信息。4.根据权利要求3所述的方法,其特征在于,所述对所述第一目标特征和所述第二目标特征进行特征融合,得到目标融合特征,包括:将所述第一目标特征和所述第二目标特征进行加和处理,得到第一融合子信息;将所述第一目标特征和所述第二目标特征进行点乘处理,得到第二融合子信息;将所述第一融合子信息和所述第二融合子信息进行加和处理,得到所述目标融合特征。5.根据权利要求3所述的方法,其特征在于,所述基于所述目标融合特征,确定所述目标微生物的类...

【专利技术属性】
技术研发人员:黎瑛张捷
申请(专利权)人:深圳市商汤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1