一种二分类模型的训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号：38576735 阅读：11 留言：0更新日期：2023-08-26 23:24

本发明专利技术实施例公开了一种二分类模型的训练方法、装置、电子设备和存储介质，该方法包括：获取当次周期对应的当前样本数据集，其中，当前样本数据集包括：多个当前样本数据和每个当前样本数据对应的样本分类标签；基于当前样本数据集，对二分类模型进行当次迭代训练，并获得二分类模型当次训练输出的每个当前样本数据对应的预测分类结果；基于每个预测分类结果和样本分类标签，对每个当前样本数据进行归一化处理；基于归一化后的当前样本数据集，对二分类模型进行下次迭代训练，直到当前迭代次数等于训练迭代次数时，确定二分类模型当次周期训练完成。通过本发明专利技术实施例的技术方案，可以提高二分类模型训练的效率和准确性。以提高二分类模型训练的效率和准确性。以提高二分类模型训练的效率和准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种二分类模型的训练方法、装置、电子设备和存储介质

[0001]本专利技术实施例涉及计算机技术，尤其涉及一种二分类模型的训练方法、装置、电子设备和存储介质。

技术介绍

[0002]随着计算机技术的发展，深度学习模型被广泛应用。在二分类模型使用前需要使用大量多样化的样本数据对二分类模型进行训练。
[0003]目前，在一些周期性产生数据的场景中，比如每年的11月份产生的数据，这种数据中往往存在部分特征值缺失的情况，即未采集到某些特征对应的特征值。并且同一场景下的样本数据中存在相似，甚至相同的特征值。可见，利用这种多样性较差的样本数据直接进行二分类模型训练，会导致二分类模型的训练效果不佳，甚至训练后的模型会出现欠拟合的情况。

技术实现思路

[0004]本专利技术实施例提供了一种二分类模型的训练方法、装置、电子设备和存储介质，以快速地完成二分类模型训练，并提高二分类模型训练的效率和准确性。
[0005]第一方面，本专利技术实施例提供了一种二分类模型的训练方法，包括：
[0006]获取当次周期对应的当前样本数据集，其中，所述当前样本数据集包括：多个当前样本数据和每个当前样本数据对应的样本分类标签；
[0007]基于当前样本数据集，对二分类模型进行当次迭代训练，并获得所述二分类模型当次训练输出的每个当前样本数据对应的预测分类结果；
[0008]基于每个当前样本数据对应的预测分类结果和所述样本分类标签，对每个当前样本数据进行归一化处理，获得归一化后的当前样本数据集；
...

【技术保护点】

【技术特征摘要】
1.一种二分类模型的训练方法，其特征在于，包括：获取当次周期对应的当前样本数据集，其中，所述当前样本数据集包括：多个当前样本数据和每个当前样本数据对应的样本分类标签；基于当前样本数据集，对二分类模型进行当次迭代训练，并获得所述二分类模型当次训练输出的每个当前样本数据对应的预测分类结果；基于每个当前样本数据对应的预测分类结果和所述样本分类标签，对每个当前样本数据进行归一化处理，获得归一化后的当前样本数据集；基于归一化后的当前样本数据集，对所述二分类模型进行下次迭代训练，直到当前迭代次数等于训练迭代次数时，确定所述二分类模型当次周期训练完成。2.根据权利要求1所述的方法，其特征在于，获取多个当前样本数据，包括：获取多个原始样本数据；基于每个原始样本数据中每个原始特征对应的原始特征值，确定同一原始特征对应的非空特征值数量；基于每个原始特征对应的非空特征值数量，确定目标原始特征；将每个原始样本数据中除了目标原始特征以外的剩余原始特征和剩余原始特征对应的特征值进行删除，并将删除后的原始样本数据作为当前样本数据。3.根据权利要求1所述的方法，其特征在于，所述基于每个当前样本数据对应的预测分类结果和所述样本分类标签，对每个当前样本数据进行归一化处理，获得归一化后的当前样本数据集，包括：将每个当前样本数据对应的预测分类结果和样本分类标签进行比较，确定预测分类结果与样本分类标签一致的第一当前样本数据和预测分类结果与样本分类标签不一致的第二当前样本数据；对所述第一当前样本数据进行正向归一化处理，获得正向归一化后的第一当前样本数据；对所述第二当前样本数据进行逆向归一化处理，获得逆向归一化后的第二当前样本数据。4.根据权利要求3所述的方法，其特征在于，所述对所述第二当前样本数据进行逆向归一化处理，获得逆向归一化后的第二当前样本数据，包括：获取当前样本数据集中每个原始特征对应的最大特征值和最小特征值，并将所述最小特征值与所述最大特征值进行相减，获得第一差值；将每个第二当前样本数据中每个原始特征对应的原始特征值与所述最大特征值进行相减，获得每个第二当前样本数据中每个原始特征对应的第二差值；将每个第二当前样本数据中每个原始特征对应的第二差值与所述第一差值进行相除，并将相除结果确定为每个第二当前样本数据中每个原始特征对应的逆向归一化值。5.根据权利要求3所述的方法，其...

【专利技术属性】
技术研发人员：杨建雄，杜志高，
申请(专利权)人：北京思特奇信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人