一种基于LightGBM模型的二手车快速定价方法及系统技术方案

技术编号:39593212 阅读:5 留言:0更新日期:2023-12-03 19:48
本发明专利技术涉及一种基于LightGBM模型的二手车快速定价方法及系统,包括对二手车历史数据进行预处理,将预处理后的数据进行特征分析,获得车辆特征;将所述车辆特征输入预先构建LightGBM模型,通过训练得到车辆估值模型;通过车辆估值模型预估待估车辆成交价;对模型输出的预估价格进行校准,获得车辆估值结果。上述方案不仅解决了传统方法依赖人工经验,难以快速复制问题,还解决了单纯树模型因无法感知市场动态导致预测结果偏差大的问题;在架构上,采用离线训练与计算,在线预测方式,提升预测效率。测效率。测效率。

【技术实现步骤摘要】
一种基于LightGBM模型的二手车快速定价方法及系统


[0001]本专利技术属于计算机
,具体涉及一种基于LightGBM模型的二手车快速定价方法及系统。

技术介绍

[0002]1.重置成本法:指在现时条件下重新购置一辆全新状态的被评估车辆所需的全部成本(即完全重置成本。简称重置全价),减去该被评估车辆的各种陈旧贬值后的差额作为被评估车辆现时价格的一种评估方法。一般来讲,一辆车一年之内二手车价格较其新车价格相比损失20%左右,一年之后按每年折价10%来进行计算。此公式因为运算快所以大多数二手车收购商经常使用。有经验的车商经常使用。这种方法较粗,未考虑各品牌车系因市占率对保值率的影响,也未考虑每辆二手车的车况特性差异。
[0003]2.现行估价法是指以同款式、同年份、同使用期限的车辆在二手车市场上的平均价格为基础,再考虑所评估车辆的现时技术状况评定系数,以平均价格乘以系数从而判定车辆价格。这种方法是最贴近于市场真实价格的方法,不过有一个前提条件是具备大量的市场真实交易数据作为样本,这样的平均价格更具代表性。美国的KBB模型(基于Manheim平台每年超过350万上拍车辆数据沉淀)和公平价的大数据线性加权模型都可以为二手车市场提供一个相对透明切实可行的评估方法二手车收购估价的常用方法。还有就是需要识别并剔除异常交易记录。
[0004]3.专家定价法:人工基于车辆的基础属性及实时外部交易环境凭经验给出车辆的价格判断,这种高度依赖专家经验的方法,对于低频、少量、小区域范围小场景的二手车车商适用性很广泛,而难以保障高频、规模化、全国范围多场景的经营过程中对于定价快速、高效的要求,也难以控制经营成本和风险管理;
[0005]4.基于二手车价格数据构建模型自动估值:树模型(随机森林、梯度下降)对数据质量要求较高;相关技术中存在的基于机器学习的二手车估价模型无法动态感知市场行情的变化,导致预测结果与实际偏差较大的问题。
[0006]综上,上述现有技术方案均存在以下缺陷:
[0007]1)准确率存在不足:专家经验受人为经验影响较大,而且纯机器学习模型对市场动态感知不明显,导致偏差较大。
[0008]2)数据质量要求高,且真实成交数据要求高。

技术实现思路

[0009]为了克服上述技术的不足,本专利技术提供了一种基于LightGBM模型的二手车快速定价方法及系统,不仅解决了传统方法依赖人工经验,难以快速复制问题,还解决了单纯树模型因无法感知市场动态导致预测结果偏差大的问题;在架构上,采用离线训练与计算,在线预测方式,提升预测效率。
[0010]本专利技术的目的是采用下述技术方案实现的:
[0011]一种基于LightGBM模型的二手车快速定价方法,所述方法包括:
[0012]对二手车历史数据进行预处理,将预处理后的数据进行特征分析,获得车辆特征;
[0013]将所述车辆特征输入预先构建LightGBM模型,通过训练得到车辆估值模型;
[0014]通过车辆估值模型预估待估车辆成交价;
[0015]对模型输出的预估价格进行校准,获得车辆估值结果。
[0016]优选的,所述对二手车历史数据进行预处理之前还包括:采集单位时间段内的二手车历史数据,包括车辆基础信息、使用信息和交易信息。
[0017]优选的,所述对二手车历史数据进行预处理,将预处理后的数据进行特征分析,获得车辆特征包括:
[0018]获取历史单位时间段的车辆信息和车况信息;
[0019]采用空值填充、异常值修正、数据类型转换方式对所述车辆信息和车况信息进行异常信息处理:
[0020]基于处理异常数据的车辆和车况信息,建立特征工程信息;所述特征工程信息包括品牌成交量、区域成交量、品牌成交价均值/方差;
[0021]将车辆、车况信息与特征工程信息归类,分成连续列、分类列,并针对每一类进行数据处理,将处理后的数据作为车辆特征。
[0022]进一步地,所述车辆信息包括:制造方、品牌、车系、车型、年款、排放标准、新车指导价、排量、马力、油耗、车辆类型、合资类型、供油方式、变速箱类型、综合油耗、车身类型;
[0023]所述车况信息:里程、上牌区域、车身颜色、车龄、营运性质、过户次数、选配部件、车况星级、车辆来源、维修保养记录、出险记录。
[0024]优选的,所述对模型输出的预估价格进行校准,获得车辆估值结果包括:
[0025]根据车辆的车龄和品牌车系维度保值率的关联关系,得到车辆回归保值率;
[0026]基于回归保值率计算回归估值;其中,回归估值=回归保值率*新车指导价;
[0027]通过比较获得所述回归估值与模型估值之间的偏差,根据偏差大小确定车辆估值。
[0028]进一步地,所述根据车辆的车龄和品牌车系维度保值率的关联关系,得到车辆回归保值率包括:
[0029]根据二手车历史数据的交易信息,确定品牌车型维度保值率;
[0030]根据品牌车型维度保值率曲线,获得车辆回归保值率。
[0031]进一步地,所述确定品牌车型维度保值率包括:
[0032]根据任一品牌车型在单位时间范畴内的成交车辆数据,计算每台车的车龄和保值率;其中,车龄指成交日期与上牌日期的月份差;保值率指成交价与新车指导价的比值;
[0033]若该品牌车型在单位时间范畴内成交的车辆数不足预设统计量,导致车龄与保值率不能拟合成指数函数,则选取该车辆对应的品牌车系维度数据,重新拟合;
[0034]如果品牌车系维度仍旧无法拟合成指数函数,则取该品牌维度保值率;
[0035]如果品牌维度仍旧无法拟合成指数函数,则将该品牌设置为小众品牌;
[0036]将所有小众品牌成交记录合并,根据统计分析,线性拟合得到不同车龄对应的保值率,并将所述保值率作为该品牌车型的维度保值率。
[0037]进一步地,所述根据品牌车型维度保值率曲线,获得车辆回归保值率包括:
[0038]根据品牌车型维度保值率曲线,输入每台车的车龄,得到车辆的回归保值率;
[0039]所述得到车辆回归保值率之后还包括:根据车辆回归保值率对成交保值率偏低的车辆进行异常交易处理;
[0040]其中,所述成交保值率偏低的车辆包括:
[0041]针对在委托商和车商交易数据中,获取车辆成交保值率低于第一阈值的比例超过第二阈值的车辆;
[0042]基于车辆维度,以车辆成交价和车况为指标对车辆进行筛选,成交保值率偏低超过第三阈值的车辆。
[0043]进一步地,所述根据偏差大小确定车辆估值包括:
[0044]若回归估值与模型估值偏差低于阈值d,则将模型估值作为车辆最终估值;
[0045]若回归估值与模型估值偏差高于阈值d,则执行以下处理:
[0046]从预设时间范畴内的历史成交数据中,找出与待估车辆相同车辆相近车况相近里程的车辆交易信息;
[0047]若记录数高于N条,求出平本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于LightGBM模型的二手车快速定价方法,其特征在于,所述方法包括:对二手车历史数据进行预处理,将预处理后的数据进行特征分析,获得车辆特征;将所述车辆特征输入预先构建LightGBM模型,通过训练得到车辆估值模型;通过车辆估值模型预估待估车辆成交价;对模型输出的预估价格进行校准,获得车辆估值结果。2.如权利要求1所述的方法,其特征在于,所述对二手车历史数据进行预处理之前还包括:采集单位时间段内的二手车历史数据,包括车辆基础信息、使用信息和交易信息。3.如权利要求1所述的方法,其特征在于,所述对二手车历史数据进行预处理,将预处理后的数据进行特征分析,获得车辆特征包括:获取历史单位时间段的车辆信息和车况信息;采用空值填充、异常值修正、数据类型转换方式对所述车辆信息和车况信息进行异常信息处理:基于处理异常数据的车辆和车况信息,建立特征工程信息;所述特征工程信息包括品牌成交量、区域成交量、品牌成交价均值/方差;将车辆、车况信息与特征工程信息归类,分成连续列、分类列,并针对每一类进行数据处理,将处理后的数据作为车辆特征。4.如权利要求3所述的方法,其特征在于,所述车辆信息包括:制造方、品牌、车系、车型、年款、排放标准、新车指导价、排量、马力、油耗、车辆类型、合资类型、供油方式、变速箱类型、综合油耗、车身类型;所述车况信息:里程、上牌区域、车身颜色、车龄、营运性质、过户次数、选配部件、车况星级、车辆来源、维修保养记录、出险记录。5.如权利要求1所述的,其特征在于,所述对模型输出的预估价格进行校准,获得车辆估值结果包括:根据车辆的车龄和品牌车系维度保值率的关联关系,得到车辆回归保值率;基于回归保值率计算回归估值;其中,回归估值=回归保值率*新车指导价;通过比较获得所述回归估值与模型估值之间的偏差,根据偏差大小确定车辆估值。6.如权利要求5所述的方法,其特征在于,所述根据车辆的车龄和品牌车系维度保值率的关联关系,得到车辆回归保值率包括:根据二手车历史数据的交易信息,确定品牌车型维度保值率;根据品牌车型维度保值率曲线,获得车辆回归保值率。7.如权利要求6所述的方法,其特征在于,所述确定品牌车型维度保值率包括:根据任一品牌车型在单位时间范...

【专利技术属性】
技术研发人员:郭建广宫伟来关志勇
申请(专利权)人:上海信宝博通电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1