【技术实现步骤摘要】
一种基于XGBoost推荐算法的车辆销量预测方法
本专利技术属于销量预测
,涉及一种车辆销量预测方法,具体涉及一种基于XGBoost推荐算法的车辆销量预测方法。
技术介绍
精准的乘用车销量预测对乘用车企业和政府至关重要。对于乘用车企业,乘用车的研发和生产过程需要比较大的研发费用、时间成本和库存成本,乘用车企业如何利用消费者购买乘用车时,选购车辆所依据的车辆属性、销售价格、销售日期等销售数据进行精准的车辆销量预测,从而进行合理的生产计划制定,调整生产,控制成本,减少损失非常关键。对于政府部门,可以利用乘用车销量预测来把握乘用车市场的发展,监测产能,调整乘用车行业发展政策。鉴于精确的车辆销量预测广泛的应用前景和巨大的经济价值,近年来车辆销量预测已成为汽车生产企业、政府部门和学术研究者备受关注的前沿方向。现有的车辆销量预测方法都是从国内生产总值、收入水平、可支配收入等经济指标来分析对车辆销量影响的因素,然后进行销量预测,但是没有从消费者的需求出发考虑品牌、车型、车型类别、排量、成交价格段、功率、燃料种类、车辆大小等车辆本身指标,造成车辆预测对经济单一指标依赖性太强,预测值波动过大和预测精度较低等,无法提高精确的车辆销量预测。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种基于XGBoost推荐算法的车辆销量预测方法。本专利技术所采用的技术方案是:一种基于XGBoost推荐算法的车辆销量预测方法,其特征在于,包括以下步骤:步骤1:获取原始数据集;步骤2:对原 ...
【技术保护点】
1.一种基于XGBoost推荐算法的车辆销量预测方法,其特征在于,包括以下步骤:/n步骤1:获取原始数据集;/n步骤2:对原始数据集进行处理,包括均值填充、XGBoost填充和”0”值填充操作,最后输出完整的数据集;/n步骤3:针对输出完整的数据集进行特征提取;/n采用one_hot编码获取车辆的类别特征,采用生成唯一配置获取车辆基础特征,采用基于时序差分滑动窗口方法获取车辆的时序特征,形成特征集供模型训练和预测使用;/n步骤4:根据具体需求提取出对应数据特征,将数据特征输入到线性回归模型、GBDT、XGBoost和LSTM神经网络模型中;并从这四个预测模型中,根据预测精度和性能选出最好的模型XGBoost预测算法作为高精度车辆销量预测模型;/n步骤5:将提取到的特征数据X
【技术特征摘要】
1.一种基于XGBoost推荐算法的车辆销量预测方法,其特征在于,包括以下步骤:
步骤1:获取原始数据集;
步骤2:对原始数据集进行处理,包括均值填充、XGBoost填充和”0”值填充操作,最后输出完整的数据集;
步骤3:针对输出完整的数据集进行特征提取;
采用one_hot编码获取车辆的类别特征,采用生成唯一配置获取车辆基础特征,采用基于时序差分滑动窗口方法获取车辆的时序特征,形成特征集供模型训练和预测使用;
步骤4:根据具体需求提取出对应数据特征,将数据特征输入到线性回归模型、GBDT、XGBoost和LSTM神经网络模型中;并从这四个预测模型中,根据预测精度和性能选出最好的模型XGBoost预测算法作为高精度车辆销量预测模型;
步骤5:将提取到的特征数据Xt={Xt1,Xt2,Xt3,...,XtT}输入到基于XGBoost模型中,实现对车辆销量的预测;
所述XGBoost模型为:
其中,是基于时间序列t的预测值,Xt={Xt1,Xt2,Xt3,...,XtT}是提取到的基于时间序列的特征集合,ρ是模型的参数集合,Remp(f)是经验风险;
对于线性回归预测和非线性回归的预测函数f分别为:
F(x,ρ)=ax+b(1)
F(x,ρ)=(a.ψ(x))+b(2)
对于数据在输入空间中是线性的数据,使用公式1进行线性回归预测;对于数据在输入空间中不是线性数据,通过核函数将数据映射到高维的特征空间去执行高维特征空间中的线性回归,从而将经验风险最小化,提高车辆销量的预测精度。
2.根据权利要求1所述的基于XGBoost推荐算法的车辆销量预测方法,其特征在于:步骤2中所述均值填充,首先定义R={Pj,Cj,Bj,CLj}表示一个组,j属于N表示组的序号,Pj表示销售省份ID,Cj表示销售城市ID,Bj表示销售车辆品牌ID,CLj表示销量车辆车型ID,R内字段都相同的数据表示为同一个组;在进行均值填充时,同一组内的数据按照获取需要填充数据的均值,其中Avgi表示组内均值,Sumi表示组内需要填充数据的的各个条目相加的总值,numi为组内条目数目。
3.根据权利要求1所述的基于XGBoost推荐算法的车辆销量预测方法,其特征在于:步骤2中所述XGBoost填充,对于同一组内的相同省份、相同汽车品牌和相同车型的数据,利用已知的基础数据输入到XGBoost算法中进行预测,然后将预测出的值,填入到缺失数据中,进行XGBoost填充。
4.根据权利要求1所述的基于XGBoost推荐算法的车辆销量预测方法,其特征在于:步骤2中所述”0”值填充,主要针对一些无法填充,但是如果删除该字段...
【专利技术属性】
技术研发人员:吴黎兵,夏振厂,樊浩南,吴煜,陈俊杰,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。