建立商品数据预测模型的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38740740 阅读:13 留言:0更新日期:2023-09-08 23:25
本发明专利技术涉及一种建立商品数据预测模型的方法,包括步骤:获取原始商品特征,对原始商品特征进行特定特征衍生,得到特定衍生特征;对所述原始商品特征和所述特定衍生特征进行交叉特征衍生,得到交叉衍生特征;根据所述原始商品特征和所述交叉衍生特征进行特征筛选,得到目标商品特征;通过所述目标商品特征构建线性回归的商品数据预测模型;其中,所述特定特征衍生包括以下至少一项:倒置特征衍生、次方特征衍生和异常特征衍生。相对于现有技术,本发明专利技术能够保证预测模型的时效性,同时提高预测准确率。准确率。准确率。

【技术实现步骤摘要】
建立商品数据预测模型的方法、装置、电子设备及存储介质


[0001]本专利技术涉及商品数据预测
,尤其是涉及一种商品数据预测及建立商品数据预测模型的方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]在电商行业,通常根据商品特征,如商品价格、商品库存、商品性能参数等,来预测预测未来的商品数据,如商品销售量、未来定价等,能够为运营者的运营决策提供参考。
[0003]目前,常用深度学习模型进行商品数据的预测。然而,影响商品数据的商品特征的数量非常多,这对于深度学习模型来说,商品特征的数量决定了深度学习模型的调参量,而调参量过大则需要较长的训练时间,而训练时间过长将影响数据预测模型的时效性。
[0004]为了保证模型时效性,可采用训练耗时短的线性回归模型进行商品数据的预测。但是,目前通过线性回归模型来预测商品数据的准确率较低。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺点与不足,提供一种商品数据预测方法,能够保证预测模型的时效性,同时提高预测准确率。
[0006]本专利技术是通过以下技术方案实现的:一种建立商品数据预测模型的方法,包括步骤:
[0007]获取原始商品特征,对原始商品特征进行特定特征衍生,得到特定衍生特征;
[0008]对所述原始商品特征和所述特定衍生特征进行交叉特征衍生,得到交叉衍生特征;
[0009]根据所述原始商品特征和所述交叉衍生特征进行特征筛选,得到目标商品特征;
[0010]通过所述目标商品特征构建线性回归的商品数据预测模型;
[0011]其中,所述特定特征衍生包括以下至少一项:倒置特征衍生、次方特征衍生和异常特征衍生;
[0012]所述倒置特征衍生包括步骤:对所述原始商品特征进行倒置处理;
[0013]所述次方特征衍生包括步骤:对所述原始商品特征进行次方计算;
[0014]所述异常特征衍生包括步骤:获取评估时段的所述原始商品特征数据作为评估值;获取评估时段前一时段的相同原始商品特征数据作为基准值;比较所述评估值与所述基准值,根据比较结果得到所述特定衍生特征。
[0015]相对于现有技术,本专利技术通过倒置特征衍生使与所预测的商品数据呈反比例关系的原始商品特征更适应线性回归的商品数据预测模型;通过次方特征衍生突出变化幅度小的原始商品特征的变化幅度,以增加线性回归的商品数据预测模型对此类原始商品特征的敏感度;通过异常特征衍生增加异常特征,对异常数据进行标记以辅助商品数据预测模型对异常数据的辨别,从而提高商品数据预测模型的预测准确率。同时,通过交叉特征衍生能够保留对商品数据预测贡献度小但存在一定影响的特征,从而进一步提高商品数据预测模
型的预测准确率。
[0016]进一步地,根据所述原始商品特征和所述交叉衍生特征进行特征筛选,得到目标商品特征,包括步骤:
[0017]以所有所述原始商品特征和所述交叉衍生特征对应的特征为第一特征组合,通过所述第一特征组合构建第一预测模型;
[0018]对所述第一预测模型进行训练;
[0019]通过训练好的所述第一预测模型对第一评估集进行线性回归处理,得到第一预测结果,对所述第一预测结果进行评估,得到第一评估值;
[0020]针对所述原始商品特征和所述交叉衍生特征中的每一特征,构建一缺失该特征的缺失特征组合,通过每一所述缺失特征组合构建第二预测模型;
[0021]对每一所述第二预测模型进行训练;
[0022]通过训练好的所述第二预测模型对第二评估集进行线性回归处理,得到若干第二预测结果,对每一所述第二预测结果进行评估,得到若干第二评估值;
[0023]将每一所述第二评估值与所述第一评估值进行对比,根据对比结果确定所述目标商品特征。
[0024]进一步地,对所述第一预测模型进行训练,包括步骤:
[0025]获取若干组随机起始时间和随机时间长度,以每组随机起始时间为起点获取对应随机时间长度的所述第一特征组合对应的历史特征数据,得到若干组第一历史特征数据;
[0026]将每组所述第一历史特征数据按时间顺序先后划分为第一训练集、第一测试集和第一评估集;
[0027]通过所述第一训练集拟合得到所述第一预测模型的特征参数;
[0028]通过所述第一测试集验证所述第一预测模型的预测误差,根据该预测误差调整所述第一预测模型的超参数;
[0029]交替执行前述步骤,直至获得最优的第一预测模型特征参数。
[0030]进一步地,对每一所述第二预测模型进行训练,包括步骤:
[0031]获取若干组随机起始时间和随机时间长度,以每组随机起始时间为起点获取对应随机时间长度的缺失特征组合对应的历史特征数据,得到若干第二组历史特征数据;
[0032]将每组所述第二历史特征数据按时间顺序先后划分为第二训练集、第二测试集和第二评估集;
[0033]通过所述第二训练集拟合得到所述第二预测模型的特征参数;
[0034]通过所述第二测试集验证所述第二预测模型的预测误差,根据该预测误差调整所述第二预测模型的超参数;
[0035]交替执行前述步骤,直至获得最优的第二预测模型特征参数。
[0036]进一步地,所述第一评估值为所述第一预测结果的方差,所述第二评估值为所述第二预测结果的方差;
[0037]将每一所述第二评估值与所述第一评估值进行对比,根据对比结果确定目标商品特征的步骤包括:若一所述第二评估值大于所述第一评估值,则确定该第二评估值所对应的所述特征缺失组合所缺失的特征为目标商品特征。
[0038]进一步地,所述第一训练集、所述第一测试集和所述第一评估集的划分比例为a:
b:c,其中,a不小于每组所述第一历史特征数据的50%,b不小于c;
[0039]所述第二训练集、所述第二测试集和所述第二评估集的划分比例为a:b:c,其中,a不小于每组所述第二历史特征数据的50%,b不小于c。
[0040]进一步地,对所述原始商品特征和所述特定衍生特征进行交叉特征衍生前,包括步骤:
[0041]将所述原始商品特征中的多零特征的零值变换为近零值。
[0042]基于同一专利技术构思,本专利技术还提供一种建立商品数据预测模型的装置,包括:
[0043]特定特征衍生模块,用于获取原始商品特征,对原始商品特征进行特定特征衍生,得到特定衍生特征;
[0044]交叉特征衍生模块,用于对所述原始商品特征和所述特定衍生特征进行交叉特征衍生,得到交叉衍生特征;
[0045]特征筛选模块,用于根据所述原始商品特征和所述交叉衍生特征进行特征筛选,得到目标商品特征;
[0046]模型构建模块,用于通过所述目标商品特征构建线性回归的商品数据预测模型。
[0047]其中,所述特定特征衍生模块至少包括以下一项:倒置特征衍生子模块、次方特征衍生子模块和异常特征衍生子模块;
[0048]所述倒置特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建立商品数据预测模型的方法,其特征在于,包括步骤:获取原始商品特征,对原始商品特征进行特定特征衍生,得到特定衍生特征;对所述原始商品特征和所述特定衍生特征进行交叉特征衍生,得到交叉衍生特征;根据所述原始商品特征和所述交叉衍生特征进行特征筛选,得到目标商品特征;通过所述目标商品特征构建线性回归的商品数据预测模型;其中,所述特定特征衍生包括以下至少一项:倒置特征衍生、次方特征衍生和异常特征衍生;所述倒置特征衍生包括步骤:对所述原始商品特征进行倒置处理;所述次方特征衍生包括步骤:对所述原始商品特征进行次方计算;所述异常特征衍生包括步骤:获取评估时段的所述原始商品特征数据作为评估值;获取评估时段前一时段的相同原始商品特征数据作为基准值;比较所述评估值与所述基准值,根据比较结果得到所述特定衍生特征。2.根据权利要求1所述的方法,其特征在于,根据所述原始商品特征和所述交叉衍生特征进行特征筛选,得到目标商品特征,包括步骤:以所有所述原始商品特征和所述交叉衍生特征对应的特征为第一特征组合,通过所述第一特征组合构建第一预测模型;对所述第一预测模型进行训练;通过训练好的所述第一预测模型对第一评估集进行线性回归处理,得到第一预测结果,对所述第一预测结果进行评估,得到第一评估值;针对所述原始商品特征和所述交叉衍生特征中的每一特征,构建一缺失该特征的缺失特征组合,通过每一所述缺失特征组合构建第二预测模型;对每一所述第二预测模型进行训练;通过训练好的所述第二预测模型对第二评估集进行线性回归处理,得到若干第二预测结果,对每一所述第二预测结果进行评估,得到若干第二评估值;将每一所述第二评估值与所述第一评估值进行对比,根据对比结果确定所述目标商品特征。3.根据权利要求2所述的方法,其特征在于:对所述第一预测模型进行训练,包括步骤:获取若干组随机起始时间和随机时间长度,以每组随机起始时间为起点获取对应随机时间长度的所述第一特征组合对应的历史特征数据,得到若干组第一历史特征数据;将每组所述第一历史特征数据按时间顺序先后划分为第一训练集、第一测试集和第一评估集;通过所述第一训练集拟合得到所述第一预测模型的特征参数;通过所述第一测试集验证所述第一预测模型的预测误差,根据该预测误差调整所述第一预测模型的超参数;交替执行前述步骤,直至获得最优的第一预测模型特征参数。4.根据权利要求2所述的方法,其特征在于,对每一所述第二预测模型进行训练,包括步骤:获取若干组随机起始时间和随机时间长度,以每组随机起始时间为起点获取对应随机时间长度的缺失特征组合对应的历史特征数据,得到若干第二组历史特征数据;
将每组所述第二历史特征数据按时间顺序先后划分为第二训练集、第二测试集和第二评估集;通过所述第二训练集拟合得到所述第二预测模型的特征参数;通过所述第二测试集验证所述第二预测模型的预测误差,根据该预测误差调整所述第二预测模型的超参数;交替执行前述步骤,直至获得最优的第二预测模型特征参数。5.根据权利要求3或4所述的方法,其特征在于:所述第一评估值为所述第一预测结果的方差,所述第二评估值为所述第二预测结果的方差;将每一所述第二评估值与所述第一评估值进行对比,根据对比结果确定目标商品特征的步骤包括:若一所述第二评估值大于所述第一评估值,则确...

【专利技术属性】
技术研发人员:谢方敏周峰周勇伍世志刘洁莹黄庆林
申请(专利权)人:广州方舟信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1