【技术实现步骤摘要】
预测模型的训练方法、装置及电子设备
本申请涉及机器学习
,具体而言,本申请涉及一种预测模型的训练方法、装置及电子设备。
技术介绍
随着机器学习算法的发展,个性化推荐功能得到广泛适用。机器学习算法的效果受特征的影响很大,而特征工程的工作需要投入很大的人力物力成本,尤其是组合特征的提取和筛选。现有技术中一般采用DeepFM完成特征提取和筛选,DeepFM的工作将原理是:将深度学习和因子分解机算法结合起来,自动组合一阶、二阶以及高阶的特征,从而减小了特征工程的成本,提高算法效果。现有的DeepFM模型对输入的数据有格式要求,如:特征位置和特征的值要一一对应,因此在DeepFM模型的训练和预测都需要对输入数据进行格式转换。尤其是部署到线上时,还需要建立特征位置的索引文件,以便从索引中查询特征取值的位置。因而现有的DeepFM模型的线上处理存在开销成本高的问题。另外,现有DeepFM模型对多值属性的特征的支持度低,因此存在预测精度低的问题。
技术实现思路
本申请提供了一种预测模型的训练方法、装置及电子 ...
【技术保护点】
1.一种预测模型的训练方法,其特征在于,包括:/n获取样本数据;/n利用预构建的DeepFM模型将所述样本数据转换为对应的向量数据;/n获取所述样本数据中任一属性特征在所述向量数据中的位置对应关系,并存储至所述DeepFM模型中,得到调整后的DeepFM模型;/n利用所述向量数据对调整后的DeepFM模型进行训练,得到DeepFM预测模型,以对所述DeepFM预测模型进行部署。/n
【技术特征摘要】
1.一种预测模型的训练方法,其特征在于,包括:
获取样本数据;
利用预构建的DeepFM模型将所述样本数据转换为对应的向量数据;
获取所述样本数据中任一属性特征在所述向量数据中的位置对应关系,并存储至所述DeepFM模型中,得到调整后的DeepFM模型;
利用所述向量数据对调整后的DeepFM模型进行训练,得到DeepFM预测模型,以对所述DeepFM预测模型进行部署。
2.根据权利要求1所述的方法,其特征在于,所述DeepFM模型包括FM子模型和DNN子模型,所述利用所述向量数据对调整后的DeepFM模型进行训练,包括:
将所述向量数据中任一向量特征进行预处理,以得到所述DeepFM模型的嵌入层;
对所述嵌入层进行处理,得到训练好的所述FM子模型和所述DNN子模型,以依据所述FM子模型的FM输出部分和所述DNN子模型分的DNN输出部分进行预测。
3.根据权利要求2所述的方法,其特征在于,所述对所述嵌入层进行处理,得到训练好的所述FM子模型和所述DNN子模型,包括:
对所述嵌入层中任两个向量特征进行交叉处理,以得到所述DeepFM模型的交叉层;
将所述交叉层中所有向量特征以及所述向量数据中所有向量特征进行合并处理,得到训练好的所述FM子模型。
4.根据权利要求2所述的方法,其特征在于,所述对所述嵌入层进行处理,得到训练好的所述FM子模型和所述DNN子模型,包括:
将所述嵌入层中所有向量特征输入至预设的神经网络模型,得到训练好的所述DNN子模型。
5.根据权利要求4所述的方法,其特征在于,所述将所述嵌入层中所有向量特征输入至预设的神经网络模型之前,所述方法还包括:
确定所述样本数据中任一属性特征对应的属性标签;
若所述样本数据中任一属性特征对应的属性标签为多值属性,且所述属性特征在所述嵌入层中对应的向量特征中的取值为特定值的数量超过预定数量时,进行合并处理,以保...
【专利技术属性】
技术研发人员:翟羽行,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。