一种二手车定价模型的自动建模方法及计算机可读介质技术

技术编号:34272794 阅读:55 留言:0更新日期:2022-07-24 16:26
本发明专利技术涉及一种二手车定价模型的自动建模方法及计算机可读介质,其中自动建模方法包括:进行模型设计,选取最优建模方式;基于特征工程选取特征变量;数据进行预处理;筛选模型所用的最优预测算法,并对模型进行训练;将模型导出,完成二手车定价模型的自动建模。与现有技术相比,本发明专利技术具有定价准确实用等优点。本发明专利技术具有定价准确实用等优点。本发明专利技术具有定价准确实用等优点。

An automatic modeling method of used car pricing model and computer readable medium

【技术实现步骤摘要】
一种二手车定价模型的自动建模方法及计算机可读介质


[0001]本专利技术涉及二手车定价
,尤其是涉及一种二手车定价模型的自动建模方法及计算机可读介质。

技术介绍

[0002]传统的二手车评估方法主要有重置成本法、现行市价法、同类车型比较法、坐标轴法、以销定采法等。这些方法都非常依赖二手车业务人员的经验,即评价结果非常主观,从而导致二手车的评估价差异很大。
[0003]整体而言,目前二手车市场价格缺少一致性,价格不透明,相互认可度不高,急需一个统一的评估标准。当前,也有一些厂家或机构尝试将AI建模的方式预测二手车价格,但都是基于模拟数据进行拟合验证,建模的方式太过简单,没有针对实际数据进行真实的价格预测并分析其价格预测误差,价格预测精度较差,实用性不强。

技术实现思路

[0004]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种定价准确实用的二手车定价模型的自动建模方法及计算机可读介质。
[0005]本专利技术的目的可以通过以下技术方案来实现:
[0006]一种二手车定价模型的自动建模方法,所述的自动建模方法包括:
[0007]步骤1:进行模型设计,选取最优建模方式;
[0008]步骤2:基于特征工程选取特征变量;
[0009]步骤3:获取步骤2筛选出特征变量的数据集,并对数据进行预处理;
[0010]步骤4:筛选模型所用的最优预测算法,并对模型进行训练;
[0011]步骤5:将模型导出,完成二手车定价模型的自动建模。r/>[0012]优选地,所述的步骤1具体为:
[0013]首先,将汽车划分为品牌、车系、车型和车款四个层级;
[0014]其次,按照车系独立建模、车系联合建模、车型独立建模、车型联合建模、车款独立建模和车款联合建模分别建模;
[0015]最后,计算各个模型的决定系数和精度,选取最优建模方式。
[0016]更加优选地,所述的决定系数具体为:
[0017][0018]其中,SSE为预测值y_pred
i
与真实值y
i
之间的误差平方和;SST为真实值y
i
与真实值均值y_mean之间的误差平方和。
[0019]更加优选地,所述的精度具体为:
[0020]真实值与预测值之间的误差在真实值
±
10%范围内的占比。
[0021]优选地,所述的步骤2具体为:
[0022]基于预设的特征库,通过特征工程的方法筛选特征变量;
[0023]所述的特征库内所含有的特征变量包括年份、款式、车龄、公里数、卖车月、内饰、外饰、颜色、过户次数、车辆所在地、车牌所在地、综合口碑评价、市场热度和运营车辆。
[0024]优选地,所述步骤3中的预处理包括:
[0025]对采集的数据进行异常值过滤、无效值或控制插补、类别型变量的数值转换以及数据标准化处理。
[0026]优选地,所述的步骤4具体为:
[0027]步骤4

1:基于算法库,确定最优算法类型;
[0028]步骤4

2:确定步骤4

1所确定算法的模型参数;
[0029]步骤4

3:确定步骤4

1所确定算法的训练数据量。
[0030]更加优选地,所述的算法库内存储有DT算法、RF算法、GBDT算法、LR算法、XGBOOST算法和GBM算法。
[0031]更加优选地,所述的步骤4

1具体为:
[0032]基于步骤3预处理后的数据,分别作为算法库内存储的各算法的输入,获取各算法的输出,并计算各个算法的决定系数R2和精度,并筛选最优算法。
[0033]一种计算机可读介质,所述的计算机可读介质内存储有上述任一项所述的二手车定价模型的自动建模方法。
[0034]与现有技术相比,本专利技术具有以下有益效果:
[0035]定价准确实用:本专利技术中的二手车定价模型的自动建模方法采用自动化建模方法,避免人为估价带来的主观波动,并且在建模的过程中引入了较多的特征变量;同时,本专利技术中的二手车定价模型自动建模方法引入了更加实际的精度作为筛选依据,预测价格更加准确实用。
附图说明
[0036]图1为本专利技术中自动建模方法的流程示意图。
具体实施方式
[0037]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。
[0038]一种二手车定价模型的自动建模方法,其流程如图1所示,包括:
[0039]步骤1:进行模型设计,选取最优建模方式;
[0040]首先,将汽车划分为品牌、车系、车型和车款四个层级;
[0041]其次,按照车系独立建模、车系联合建模、车型独立建模、车型联合建模、车款独立建模和车款联合建模分别建模;
[0042]最后,计算各个模型的决定系数和精度,选取最优建模方式。
[0043]决定系数具体为:
[0044][0045]其中,SSE为预测值y_pred
i
与真实值y
i
之间的误差平方和;SST为真实值y
i
与真实值均值y_mean之间的误差平方和。
[0046]精度具体为:
[0047]真实值与预测值之间的误差在真实值
±
10%范围内的占比。
[0048]步骤2:基于特征工程选取特征变量;
[0049]基于预设的特征库,通过特征工程的方法筛选特征变量;
[0050]所述的特征库内所含有的特征变量包括年份、款式、车龄、公里数、卖车月、内饰、外饰、颜色、过户次数、车辆所在地、车牌所在地、综合口碑评价、市场热度和运营车辆。
[0051]步骤3:获取步骤2筛选出特征变量的数据集,并对数据进行预处理;
[0052]预处理方式包括:对采集的数据进行异常值过滤、无效值或控制插补、类别型变量的数值转换以及数据标准化处理。
[0053]步骤4:筛选模型所用的最优预测算法,并对模型进行训练;
[0054]步骤4

1:基于算法库,确定最优算法类型;
[0055]本实施例中的算法库内存储有DT算法、RF算法、GBDT算法、LR算法、XGBOOST算法和GBM算法;
[0056]具体为:基于步骤3预处理后的数据,分别作为算法库内存储的各算法的输入,获取各算法的输出,并计算各个算法的决定系数R2和精度,并筛选最优算法;
[0057]步骤4

2:确定步骤4

1所确定算法的模型参数;
[0058]步本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种二手车定价模型的自动建模方法,其特征在于,所述的自动建模方法包括:步骤1:进行模型设计,选取最优建模方式;步骤2:基于特征工程选取特征变量;步骤3:获取步骤2筛选出特征变量的数据集,并对数据进行预处理;步骤4:筛选模型所用的最优预测算法,并对模型进行训练;步骤5:将模型导出,完成二手车定价模型的自动建模。2.根据权利要求1所述的一种二手车定价模型的自动建模方法,其特征在于,所述的步骤1具体为:首先,将汽车划分为品牌、车系、车型和车款四个层级;其次,按照车系独立建模、车系联合建模、车型独立建模、车型联合建模、车款独立建模和车款联合建模分别建模;最后,计算各个模型的决定系数和精度,选取最优建模方式。3.根据权利要求2所述的一种二手车定价模型的自动建模方法,其特征在于,所述的决定系数具体为:其中,SSE为预测值y_pred
i
与真实值y
i
之间的误差平方和;SST为真实值y
i
与真实值均值y_mean之间的误差平方和。4.根据权利要求2所述的一种二手车定价模型的自动建模方法,其特征在于,所述的精度具体为:真实值与预测值之间的误差在真实值的预设百分比阈值范围内的占比。5.根据权利要求1所述的一种二手车定价模型的自动建模方法,其特征在于,所述的步骤2具体为:基于预设的特征库,通过特征工程的方法筛选特征变量;所述的特征库内所含有的特征变量包括年份、...

【专利技术属性】
技术研发人员:杨君耿炎闫楠
申请(专利权)人:芯安微众上海微电子技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1