生成车辆定价模型的方法和装置制造方法及图纸

技术编号:25917064 阅读:10 留言:0更新日期:2020-10-13 10:36
本申请实施例公开了生成车辆定价模型的方法和装置。该方法的一具体实施方式包括:获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个辅助特征值;对训练样本的多个特征值进行修正,使得在修正后的训练样本集合中,辅助特征值与车辆价格具有单调性;确定训练样本的关键特征值对应的车辆均价;将训练样本的关键特征值对应的车辆均价以及修正后的多个辅助特征值作为输入,将训练样本的车辆价格作为输出,训练得到车辆定价模型。该实施方式能够保证车辆定价的准确性,同时使车辆的特征值与车辆价格保持严格单调。

【技术实现步骤摘要】
生成车辆定价模型的方法和装置
本申请实施例涉及计算机
,具体涉及生成车辆定价模型的方法和装置。
技术介绍
根据生活经验,二手车辆的很多数量特征(例如,行驶里程、排量、年款等与数值有关的特征)与目标特征(例如,车辆价格)之间应当具备严格单调性。即,在其他特征保持不变时,若数量特征的值增大,则目标特征的值也必须增大(严格单调增)或者减小(严格单调减)。因此,在二手车定价系统中,不仅需要定价系统的指标尽可能好(例如,平均绝对百分率误差MAPE≤10%),也需要定价系统在这些数量特征变化时,体现出这种严格单调性。否则,定价系统输出的结果很难被解释,从而会严重影响用户对定价系统的信任程度。目前用于解决数量特征与目标特征之间单调变化的方法主要有线性模型、Xgboost(eXtremeGradientBoosting,极端梯度提升)模型、TensorFlowLattice(一个实现了基于快速评估和可解释模型的库,也称为插值查找表)模型等。
技术实现思路
本申请实施例提出了生成车辆定价模型的方法和装置,确定车辆价格的方法和装置。第一方面,本申请实施例提供了一种生成车辆定价模型的方法,包括:获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;对训练样本的多个第一类辅助特征值进行修正,使得在修正后的训练样本集合中,第一类辅助特征值与车辆价格具有单调性;确定训练样本的关键特征值对应的车辆均价;将训练样本的关键特征值对应的车辆均价以及修正后的多个第一类辅助特征值作为输入,将训练样本的车辆价格作为输出,训练预设的多项式线性模型,得到车辆定价模型。在一些实施例中,对训练样本的多个第一类特征值进行修正,包括:对训练样本集合中的训练样本进行聚合,将除了目标辅助特征之外的其他特征的值均相同的训练样本划分到同一训练样本组中,得到多个第一训练样本组,其中目标辅助特征为多个第一类辅助特征中的任一特征;对于多个第一训练样本组中的每个第一训练样本组,若该第一训练样本组中存在至少两个训练样本,对该第一训练样本组中的训练样本的目标辅助特征的值进行修正,使得在该第一训练样本组中,目标辅助特征的修正后的值与车辆价格具有单调性。在一些实施例中,对该第一训练样本组中的训练样本的目标辅助特征的值进行修正,包括:在该第一训练样本组中,以训练样本的车辆价格作为自变量、训练样本的目标辅助特征的值作为因变量,进行保序回归,得到修正后的值;使用修正后的值替换目标辅助特征的原始值。在一些实施例中,确定训练样本的关键特征值对应的车辆均价,包括:将训练样本的关键特征值输入到预先训练的均价生成模型中,得到对应的车辆均价。在一些实施例中,该方法还包括:对训练样本集合中的训练样本进行聚合,将具有相同关键特征值的训练样本划分到同一训练样本组中,得到多个第二训练样本组;基于每个第二训练样本组中的训练样本的车辆价格确定车辆均价;以关键特征值为输入,以输入的关键特征值对应的车辆均价为输出,训练得到均价生成模型。在一些实施例中,均价生成模型为随机森林模型。在一些实施例中,多项式线性模型的次数为2。第二方面,本申请实施例提供了一种确定车辆价格的方法,包括:接收用户提交的目标车辆的关键特征值和多个第一类辅助特征值;将目标车辆的关键特征值和多个第一类辅助特征值输入到采用第一方面中任一实现方式生成的车辆定价模型中,得到目标车辆的价格。第三方面,本申请实施例提供了一种生成车辆定价模型的装置,包括:获取单元,被配置成获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;修正单元,被配置成对训练样本的多个第一类辅助特征值进行修正,使得在修正后的训练样本集合中,第一类辅助特征值与车辆价格具有单调性;第一确定单元,被配置成确定训练样本的关键特征值对应的车辆均价;第一训练单元,被配置成将训练样本的关键特征值对应的车辆均价以及修正后的多个第一类辅助特征值作为输入,将训练样本的车辆价格作为输出,训练预设的多项式线性模型,得到车辆定价模型。在一些实施例中,修正单元包括:聚合模块,被配置成对训练样本集合中的训练样本进行聚合,将除了目标辅助特征之外的其他特征的值均相同的训练样本划分到同一训练样本组中,得到多个第一训练样本组,其中目标辅助特征为多个第一类辅助特征中的任一特征;调整模块,被配置成对于多个第一训练样本组中的每个第一训练样本组,若该第一训练样本组中存在至少两个训练样本,对该第一训练样本组中的训练样本的目标辅助特征的值进行修正,使得在该第一训练样本组中,目标辅助特征的修正后的值与车辆价格具有单调性。在一些实施例中,对该第一训练样本组中的训练样本的目标辅助特征的值进行修正,包括:在该第一训练样本组中,以训练样本的车辆价格作为自变量、训练样本的目标辅助特征的值作为因变量,进行保序回归,得到修正后的值;使用修正后的值替换目标辅助特征的原始值。在一些实施例中,第一确定单元具体被配置成将训练样本的关键特征值输入到预先训练的均价生成模型中,得到对应的车辆均价。在一些实施例中,该装置还包括:聚合单元,被配置成对训练样本集合中的训练样本进行聚合,将具有相同关键特征值的训练样本划分到同一训练样本组中,得到多个第二训练样本组;第二确定单元,被配置成基于每个第二训练样本组中的训练样本的车辆价格确定车辆均价;第二训练单元,被配置成以关键特征值为输入,以输入的关键特征值对应的车辆均价为输出,训练得到均价生成模型。在一些实施例中,均价生成模型为随机森林模型。在一些实施例中,多项式线性模型的次数为2。第四方面,本申请实施例提供了一种确定车辆价格的装置,包括:接收单元,被配置成接收用户提交的目标车辆的关键特征值和多个第一类辅助特征值;定价单元,被配置成将目标车辆的关键特征值和多个第一类辅助特征值输入到采用第一方面中任一实现方式描述的方法生成的车辆定价模型中,得到目标车辆的价格。第五方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面至第二方面中任一实现方式描述的方法。第六方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面至第二方面中任一实现方式描述的方法。本申请实施例提供的生成车辆定价模型的方法和装置,通过获取训练样本集合,之后对训练样本的多个第一类辅助特征值进行修正,然后确定训练样本的关键特征值对应的车辆均价,最后将训练样本的关键特征值对应的车辆均价以及修正后的多个第一类辅助特征值作为输入、将训练样本的车辆价格作为输出,训练预设的多项式线性模型得到车辆定价模型,从而实现了通过家居设备控制车辆能够保证车辆定价的准确性,同时使车辆的特征值与车辆价格保持严格单调。附图说明通过阅本文档来自技高网...

【技术保护点】
1.一种生成车辆定价模型的方法,包括:/n获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;/n对训练样本的多个第一类辅助特征值进行修正,使得在修正后的训练样本集合中,第一类辅助特征值与车辆价格具有单调性;/n确定训练样本的关键特征值对应的车辆均价;/n将训练样本的关键特征值对应的车辆均价以及修正后的多个第一类辅助特征值作为输入,将训练样本的车辆价格作为输出,训练预设的多项式线性模型,得到车辆定价模型。/n

【技术特征摘要】
1.一种生成车辆定价模型的方法,包括:
获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;
对训练样本的多个第一类辅助特征值进行修正,使得在修正后的训练样本集合中,第一类辅助特征值与车辆价格具有单调性;
确定训练样本的关键特征值对应的车辆均价;
将训练样本的关键特征值对应的车辆均价以及修正后的多个第一类辅助特征值作为输入,将训练样本的车辆价格作为输出,训练预设的多项式线性模型,得到车辆定价模型。


2.根据权利要求1所述的方法,其中,所述对训练样本的多个第一类特征值进行修正,包括:
对训练样本集合中的训练样本进行聚合,将除了目标辅助特征之外的其他特征的值均相同的训练样本划分到同一训练样本组中,得到多个第一训练样本组,其中所述目标辅助特征为多个第一类辅助特征中的任一特征;
对于多个第一训练样本组中的每个第一训练样本组,若该第一训练样本组中存在至少两个训练样本,对该第一训练样本组中的训练样本的所述目标辅助特征的值进行修正,使得在该第一训练样本组中,所述目标辅助特征的修正后的值与车辆价格具有单调性。


3.根据权利要求2所述的方法,其中,所述对该第一训练样本组中的训练样本的所述目标辅助特征的值进行修正,包括:
在该第一训练样本组中,以训练样本的车辆价格作为自变量、训练样本的所述目标辅助特征的值作为因变量,进行保序回归,得到修正后的值;
使用修正后的值替换所述目标辅助特征的原始值。


4.根据权利要求1所述的方法,其中,所述确定训练样本的关键特征值对应的车辆均价,包括:
将训练样本的关键特征值输入到预先训练的均价生成模型中,得到对应的车辆均价。


5.根据权利要求4所述的方法,其中,所述方法还包括:
对训练样本集合中的训练样本进行聚合,将具有相同关键特征值的训练样本划分到同一训练样本组中,得到多个第二训练样本组;
基于每个第二训练样本组中的训练样本的车辆价格确定车辆均价;
以关键特征值为输入,以输入的关键特征值对应的车辆均价为输出,训练得到均价生成模型。


6.一种确定车辆价格的方法,包括:
接收用户提交的目标车辆的关键特征值和多个第一类辅助特征值;
将所述目标车辆的关键特征值和多个第一类辅助特征值输入到采用权利要求1-5中任一所述的方法生成的车辆定价模型中,得到所述目标车辆的价格。


7.一种生成车辆定价模型的装置,包括:
获取单元,被配置成获取训练样本集合,其中训练样本包括多个特征值以及与多个特征值对应的车辆价格,多个特征值包括关键特征值和多个第一类辅助特征值;
修正单元,被配置成对训练样本的多个第一类辅助特征值进行修正,...

【专利技术属性】
技术研发人员:雷超
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1