回归模型的训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号：31456132 阅读：32 留言：0更新日期：2021-12-18 11:22

本申请提出一种回归模型的训练方法、装置、电子设备和存储介质，其中训练方法包括：获取已标注样本池中已标注用户的特征和标注的标签数据；根据已标注用户的特征和所述标签数据训练得到回归模型；根据回归模型获取对应的查询策略；根据查询策略确定对应的目标未标注用户；获取目标未标注用户的特征和标注的标签数据；将目标未标注用户的特征和标注的标签数据添加至已标注样本池中。由此，该方法根据根据查询策略确定对应的目标未标注用户，将目标未标注用户的特征和标注的标签数据添加至已标注样本池中，采取主动学习的方式来实现回归模型的训练，相较于现有技术中基于随机抽样获取的训练样本进行模型训练，有助于提高模型的泛化能力。泛化能力。泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
回归模型的训练方法、装置、电子设备和存储介质

[0001]本申请涉及深度学习
，尤其涉及一种回归模型的训练方法、装置、电子设备和存储介质。

技术介绍

[0002]目前，回归模型在用户刻画、企业决策等领域中得到了广泛的应用。例如，回归模型可基于用户的基本信息、消费记录和消费偏好(例如，收藏商品)等信息，刻画用户的收入信息；或者，回归模型可基于企业的销售额信息、所处行业信息、经营状态等信息，预测企业的注册资金。然而，相关技术中的回归模型的训练方法，大多基于完全随机抽样或者分层抽样来获取训练样本，灵活性较差。

技术实现思路

[0003]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]为此，本申请第一方面实施例提出一种回归模型的训练方法，根据已标注用户的特征和标签数据训练得到回归模型，根据回归模型获取对应的查询策略，并根据查询策略确定对应的目标未标注用户，将目标未标注用户的特征和标注的标签数据添加至已标注样本池中。由此，采取主动学习的方式来实现回归模型的训练，相较于现有技术中基于随...

【技术保护点】

【技术特征摘要】
1.一种回归模型的训练方法，其特征在于，包括：获取已标注样本池中已标注用户的特征和标注的标签数据；根据所述已标注用户的特征和所述标签数据训练得到回归模型；根据所述回归模型获取对应的查询策略；根据所述查询策略确定对应的目标未标注用户；获取所述目标未标注用户的特征和标注的标签数据；将所述目标未标注用户的特征和标注的标签数据添加至所述已标注样本池中。2.根据权利要求1所述的训练方法，其特征在于，所述将所述目标未标注用户的特征和标注的标签数据添加至所述已标注样本池中之后，还包括以下步骤中的至少一个：所述回归模型未达到预设的期望性能和/或未触碰预设的训练结束条件，则继续执行所述获取已标注样本池中已标注用户的特征和标注的标签数据步骤；继续执行所述获取已标注样本池中已标注用户的特征和标注的标签数据步骤。3.根据权利要求1所述的训练方法，其特征在于，所述回归模型为回归树模型或随机森林模型。4.根据权利要求3所述的训练方法，其特征在于，所述回归模型为所述回归树模型，所述根据所述回归模型获取对应的查询策略，包括：计算所述回归树模型中叶子节点的纯度；根据所述叶子节点的纯度确定目标路径分支；将所述目标路径分支确定为所述查询策略。5.根据权利要求4所述的训练方法，其特征在于，所述根据所述叶子节点的纯度确定目标路径分支，包括：将所述叶子节点的纯度最低的叶子节点对应的路径分支，确定为所述目标路径分支。6.根据权利要求3所述的训练方法，其特征在于，所述回归模型为所述随机森林模型，所述根据所述回归模型获取对应的查询策略，包括：计算所述随机森林模型中所述回归树中叶子节点的纯度；计算同一路径分支对应的所述叶子节点的纯度的平均值；根据所述平均值确定目标路径分支；将所述目标路径分支确定为所述查询策略。7.根据权利要求6所述的训练方法，其特征在于，所述根据所述平均值确定目标路径分支，包括：将所述平均值最低的路径分支确定为所述目标路径分支。8.根据权利要求4
‑
7任一项所述的训练方法，其特征在于，计算所述叶子节点的纯度，包括：计算所述叶子节点的信息差异性指标，所述信息差异性指标包括以下指标中的至少一个：平均绝对百分比误差、对称平均绝对百分比误差和变异系数；根据所述信息差异性指标计算所述叶子节点的纯度。9.一种回归模型的训练装置，其特征在于，包括：第一获取模块，用于获取已标注样本池中已标注用户的特征和标注的标签数据；训练模块，用于根据所述已标注用户的特征和所述标签数据训练得到回归模型；
第二获取模块，用于根据所述回归模型获取对应的查询策略；确定模块，用于根据所述查询策略确定对应的目...

【专利技术属性】
技术研发人员：郭洋，郑爱国，田国刚，彭南博，
申请(专利权)人：京东科技控股股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人