分类模型的构建方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34267776 阅读:13 留言:0更新日期:2022-07-24 15:19
本发明专利技术为人工智能技术的分类模型技术领域,本发明专利技术提供了一种分类模型的构建方法、装置、计算机设备及存储介质,其中,所述方法包括:获取数据集及多个基分类器,利用数据集对多个基分类器进行K折交叉验证,获取每个基分类器在交叉验证后得到的预测值,将每个基分类器在交叉验证后得到的预测值添加至数据集中,得到目标数据集,利用目标数据集对预设的深度神经网络模型进行训练,计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在指标值满足要求后,得到训练好的分类模型,从而实现自动标注,能够准确地训练得到高精度的分类模型。模型。模型。

Construction method, device, computer equipment and storage medium of classification model

【技术实现步骤摘要】
分类模型的构建方法、装置、计算机设备及存储介质


[0001]本专利技术涉及人工智能技术的分类模型
,具体而言,本专利技术涉及一种分类模型的构建方法、装置、计算机设备及存储介质。

技术介绍

[0002]人工智能领域的发展日新月异,特别是随着深度学习技术的广泛应用,其在物体检测、识别等领域取得了突破性的进展。一般地,人工智能AI算法主要是基于监督式学习的深度学习技术,而训练数据是人工智能模型的驱动力。
[0003]传统的分类方法依赖于手工特征的选择,并要求对先验领域知识有清晰的认识,特征学习方法可以有效地检测不同模式的特征,但训练数据中缺乏标注数据时,则无法准确地训练得到高精度的分类模型。

技术实现思路

[0004]本专利技术的主要目的为提供一种分类模型的构建方法、装置、计算机设备及存储介质,以在训练数据中缺乏标注数据时,能够准确地训练得到高精度的分类模型。
[0005]为了实现上述专利技术目的,本专利技术提供一种分类模型的构建方法,其包括:
[0006]获取数据集及多个基分类器;
[0007]利用所述数据集对所述多个基分类器进行K折交叉验证,获取每个基分类器在交叉验证后得到的预测值;其中,所述K为大于2的整数;
[0008]将每个基分类器在交叉验证后得到的预测值添加至所述数据集中,得到目标数据集;
[0009]利用所述目标数据集对预设的深度神经网络模型进行训练;
[0010]计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在所述指标值满足要求后,得到训练好的分类模型。
[0011]优选地,所述利用所述目标数据集对预设的深度神经网络模型进行训练,包括:
[0012]将所述目标数据集进行随机分组,得到模型训练集与模型测试集;其中,所述模型测试集包括每个基分类器在交叉验证后得到的预测值;
[0013]基于所述模型训练集对预设的深度神经网络模型进行训练,得到第一深度神经网络模型;
[0014]所述计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在所述指标值满足要求后,得到训练好的分类模型,包括:
[0015]利用所述模型测试集对所述第一深度神经网络模型进行预测,得到第一预测值;其中,所述指标值包括第一预测值;
[0016]计算所述第一预测值与每个基分类器在交叉验证后得到的预测值的误差,得到标准误差;
[0017]在所述标准误差小于预设阈值时,得到训练好的分类模型。
[0018]优选地,所述计算所述第一预测值与每个基分类器在交叉验证后得到的预测值的误差,得到标准误差,包括:
[0019]计算所述第一预测值分别与每个基分类器在交叉验证后得到的预测值的误差,得到多个第一误差;
[0020]根据标准差计算公式计算得到所述多个第一误差对应的标准误差。
[0021]优选地,所述将每个基分类器在交叉验证后得到的预测值添加至所述数据集中,得到目标数据集,包括:
[0022]计算每个基分类器在交叉验证后得到的预测值的平均值,得到平均预测值;
[0023]将所述平均预测值添加至所述数据集中,得到目标数据集。
[0024]优选地,所述利用所述数据集对所述多个基分类器进行K折交叉验证,获取每个基分类器在交叉验证后得到的预测值,包括:
[0025]将所述数据集划分为K个子数据集;其中,所述K为所述基分类器的数量;
[0026]在每轮交叉验证时,从所述多个基分类器中不重复地选取一个基分类器作为目标基分类器;
[0027]从所述K个子数据集中不重复地选取一个子数据集作为子测试集,将剩余子数据集作为子训练集;
[0028]利用所述子训练集对所述目标基分类器进行训练,利用所述子测试集对训练后的所述目标基分类器进行预测,得到所述目标基分类器的预测值。
[0029]在一实施例中,所述预设的深度神经网络模型有多个,所述计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在确定所述指标值满足要求后,得到训练好的分类模型,包括:
[0030]计算各个训练至收敛的深度神经网络模型在预设评价指标的指标值;
[0031]从所述指标值满足要求的所有深度神经网络模型中,选择指标值最佳的深度神经网络模型作为训练好的分类模型。
[0032]进一步地,所述计算训练至收敛的深度神经网络模型在预设评价指标的指标值之后,还包括:
[0033]在所述指标值不满足要求时,调整所述深度神经网络模型的参数;
[0034]利用所述目标数据集对调整参数后的所述深度神经网络模型进行重新训练,直至所述指标值满足要求时,得到训练好的分类模型。
[0035]本专利技术还提供一种分类模型的构建装置,其包括:
[0036]获取模块,用于获取数据集及多个基分类器;
[0037]交叉验证模块,用于利用所述数据集对所述多个基分类器进行K折交叉验证,获取每个基分类器在交叉验证后得到的预测值;其中,所述K为大于2的整数;
[0038]添加模块,用于将每个基分类器在交叉验证后得到的预测值添加至所述数据集中,得到目标数据集;
[0039]训练模块,用于利用所述目标数据集对预设的深度神经网络模型进行训练;
[0040]计算模块,用于计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在所述指标值满足要求后,得到训练好的分类模型。
[0041]本专利技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机
程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0042]本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
[0043]本专利技术所提供的一种分类模型的构建方法、装置、计算机设备及存储介质,获取数据集及多个基分类器,利用数据集对多个基分类器进行K折交叉验证,获取每个基分类器在交叉验证后得到的预测值,将每个基分类器在交叉验证后得到的预测值添加至数据集中,得到目标数据集,利用目标数据集对预设的深度神经网络模型进行训练,计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在指标值满足要求后,得到训练好的分类模型,从而利用数据集交叉验证多个基分类器,提高预测值的准确性,并将每个基分类器在交叉验证后得到的预测值作为标注数据添加至数据集中,得到目标数据集,利用目标数据集对预设的深度神经网络模型进行训练,实现自动标注,能够准确地训练得到高精度的分类模型。
附图说明
[0044]图1为本专利技术一实施例的分类模型的构建方法的流程示意图;
[0045]图2为本专利技术又一实施例的分类模型的构建方法的流程示意图;
[0046]图3为本专利技术又一实施例的分类模型的构建方法的流程示意图;
[0047]图4为本专利技术另一实施例的分类模型的构建方法的流程示意图;
[0048]图5为本专利技术又一实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类模型的构建方法,其特征在于,所述方法包括:获取数据集及多个基分类器;利用所述数据集对所述多个基分类器进行K折交叉验证,获取每个基分类器在交叉验证后得到的预测值;其中,所述K为大于2的整数;将每个基分类器在交叉验证后得到的预测值添加至所述数据集中,得到目标数据集;利用所述目标数据集对预设的深度神经网络模型进行训练;计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在所述指标值满足要求后,得到训练好的分类模型。2.根据权利要求1所述的方法,其特征在于,所述利用所述目标数据集对预设的深度神经网络模型进行训练,包括:将所述目标数据集进行随机分组,得到模型训练集与模型测试集;其中,所述模型测试集包括每个基分类器在交叉验证后得到的预测值;基于所述模型训练集对预设的深度神经网络模型进行训练,得到第一深度神经网络模型;所述计算训练至收敛的深度神经网络模型在预设评价指标的指标值,在所述指标值满足要求后,得到训练好的分类模型,包括:利用所述模型测试集对所述第一深度神经网络模型进行预测,得到第一预测值;其中,所述指标值包括第一预测值;计算所述第一预测值与每个基分类器在交叉验证后得到的预测值的误差,得到标准误差;在所述标准误差小于预设阈值时,得到训练好的分类模型。3.根据权利要求2所述的方法,其特征在于,所述计算所述第一预测值与每个基分类器在交叉验证后得到的预测值的误差,得到标准误差,包括:计算所述第一预测值分别与每个基分类器在交叉验证后得到的预测值的误差,得到多个第一误差;根据标准差计算公式计算得到所述多个第一误差对应的标准误差。4.根据权利要求1所述的方法,其特征在于,所述将每个基分类器在交叉验证后得到的预测值添加至所述数据集中,得到目标数据集,包括:计算每个基分类器在交叉验证后得到的预测值的平均值,得到平均预测值;将所述平均预测值添加至所述数据集中,得到目标数据集。5.根据权利要求1所述的方法,其特征在于,所述利用所述数据集对所述多个基分类器进行K折交叉验证,获取每个基分类器在交叉验证后得到的预测值,包括:将所述数据集划分为K个子数据集;其中,所述K为所述基分类器...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1