【技术实现步骤摘要】
生成车辆定价模型的方法和装置
本申请实施例涉及计算机
,具体涉及生成车辆定价模型的方法和装置。
技术介绍
根据生活经验,二手车辆的很多数量特征(例如,行驶里程、排量、年款等与数值有关的特征)与目标特征(例如,车辆价格)之间应当具备严格单调性。即,在其他特征保持不变时,若数量特征的值增大,则目标特征的值也必须增大(严格单调增)或者减小(严格单调减)。因此,在二手车定价系统中,不仅需要定价系统的指标尽可能好(例如,平均绝对百分率误差MAPE≤10%),也需要定价系统在这些数量特征变化时,体现出这种严格单调性。否则,定价系统输出的结果很难被解释,从而会严重影响用户对定价系统的信任程度。目前用于解决数量特征与目标特征之间单调变化的方法主要有线性模型、Xgboost(eXtremeGradientBoosting,极端梯度提升)模型、TensorFlowLattice(一个实现了基于快速评估和可解释模型的库,也称为插值查找表)模型等。
技术实现思路
本申请实施例提出了生成车辆定价模型的方法和装置,确定车辆价格的方法和装置。第一方面,本申请实施例提供了一种生成车辆定价模型的方法,包括:获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;对训练样本的多个第一类辅助特征值进行修正,使得在修正后的训练样本集合中,第一类辅助特征值与车辆价格具有单调性;确定训练样本的关键特征值对应的车辆均价;将训练样本的关键特征值对应的车辆均 ...
【技术保护点】
1.一种生成车辆定价模型的方法,包括:/n获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;/n对训练样本的多个第一类辅助特征值进行修正,使得在修正后的训练样本集合中,第一类辅助特征值与车辆价格具有单调性;/n确定训练样本的关键特征值对应的车辆均价;/n将训练样本的关键特征值对应的车辆均价以及修正后的多个第一类辅助特征值作为输入,将训练样本的车辆价格作为输出,训练预设的多项式线性模型,得到车辆定价模型。/n
【技术特征摘要】
1.一种生成车辆定价模型的方法,包括:
获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;
对训练样本的多个第一类辅助特征值进行修正,使得在修正后的训练样本集合中,第一类辅助特征值与车辆价格具有单调性;
确定训练样本的关键特征值对应的车辆均价;
将训练样本的关键特征值对应的车辆均价以及修正后的多个第一类辅助特征值作为输入,将训练样本的车辆价格作为输出,训练预设的多项式线性模型,得到车辆定价模型。
2.根据权利要求1所述的方法,其中,所述对训练样本的多个第一类特征值进行修正,包括:
对训练样本集合中的训练样本进行聚合,将除了目标辅助特征之外的其他特征的值均相同的训练样本划分到同一训练样本组中,得到多个第一训练样本组,其中所述目标辅助特征为多个第一类辅助特征中的任一特征;
对于多个第一训练样本组中的每个第一训练样本组,若该第一训练样本组中存在至少两个训练样本,对该第一训练样本组中的训练样本的所述目标辅助特征的值进行修正,使得在该第一训练样本组中,所述目标辅助特征的修正后的值与车辆价格具有单调性。
3.根据权利要求2所述的方法,其中,所述对该第一训练样本组中的训练样本的所述目标辅助特征的值进行修正,包括:
在该第一训练样本组中,以训练样本的车辆价格作为自变量、训练样本的所述目标辅助特征的值作为因变量,进行保序回归,得到修正后的值;
使用修正后的值替换所述目标辅助特征的原始值。
4.根据权利要求1所述的方法,其中,所述确定训练样本的关键特征值对应的车辆均价,包括:
将训练样本的关键特征值输入到预先训练的均价生成模型中,得到对应的车辆均价。
5.根据权利要求4所述的方法,其中,所述方法还包括:
对训练样本集合中的训练样本进行聚合,将具有相同关键特征值的训练样本划分到同一训练样本组中,得到多个第二训练样本组;
基于每个第二训练样本组中的训练样本的车辆价格确定车辆均价;
以关键特征值为输入,以输入的关键特征值对应的车辆均价为输出,训练得到均价生成模型。
6.一种确定车辆价格的方法,包括:
接收用户提交的目标车辆的关键特征值和多个第一类辅助特征值;
将所述目标车辆的关键特征值和多个第一类辅助特征值输入到采用权利要求1-5中任一所述的方法生成的车辆定价模型中,得到所述目标车辆的价格。
7.一种生成车辆定价模型的装置,包括:
获取单元,被配置成获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;
修正单元,被配置成对训练样本的多个第一类辅助特征值进行修正,...
【专利技术属性】
技术研发人员:雷超,
申请(专利权)人:北京沃东天骏信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。