用于汽车保修欺诈的预测的系统和方法技术方案

技术编号:21176732 阅读:32 留言:0更新日期:2019-05-22 12:11
提出了用于确定保修索赔是欺诈性的概率的系统和方法。方法可包括基于预测欺诈检测模型和从车辆接收的一个或多个参数来确定该概率。可向操作员指示欺诈的概率。系统包括配置成使用所公开的方法的诊断装置。

System and method for forecasting automobile warranty fraud

A system and method for determining the fraudulent probability of warranty claims are proposed. The method may include determining the probability based on a predictive fraud detection model and one or more parameters received from the vehicle. The operator can be instructed about the probability of fraud. The system includes a diagnostic device configured to use the disclosed method.

【技术实现步骤摘要】
【国外来华专利技术】用于汽车保修欺诈的预测的系统和方法相关申请的交叉引用本申请要求标题为“SYSTEMSANDMETHODSFORPREDICTIONOFAUTOMOTIVEWARRANTYFRAUD(用于预测汽车保修欺诈的系统和方法)”的于2016年9月26日提交的美国临时申请号62/399,997的优先权,该临时申请的全部内容特此为了所有目的通过引用被并入。
本公开涉及用于预测后果的分析模型,更特别地涉及汽车原始设备制造商(OEM)以预测关于在工厂保修期内时对它们的产品(车辆)所需的修理的潜在保修欺诈。
技术介绍
汽车原始设备制造商(OEM)继续努力建造更好的产品并减少在车辆的寿命期间所需的修理的次数。为了鼓起消费者信心,新车辆被提供保修期。然而,一些维修中心利用OEM保修期,努力提供最高质量的维修,并执行不需要的修理。全球汽车行业估计高达6%的保修索赔成本是由于欺诈,也就是说,被报告为保修索赔的不必要的修理。如果结合修理中心记录在车辆的牌子和型号上使用预测分析模型,则OEM可能在保修欺诈发生之前发现并预测它。在保修期内修理中节省的少至1%可明显改变在OEM的给定牌子和型号产品上的盈利性的水平。因此存在预测分析模型的使用以确定给定保修索赔是欺诈性的可能性。
技术实现思路
鉴于将上面的目的,在本文提出高级分析和机器学习解决方案框架,其用于识别欺诈性保修索赔以增加操作效率、减少稽核员的时间、节省金钱、提高消费者满意度并促进更健康的维修提供商和OEM关系。本公开提供建立在现有的保修索赔和由车辆产生的诊断故障代码(DTC)之间的归属以及当在可减少保修费用并识别欺诈索赔的预测框架中实现时在DTC本身之间的因果关系的统计模型和方法。本公开概述了保修欺诈预测模型和结果,其监控索赔信息连同在车辆上产生的DTC,从而创建潜在保修欺诈的早期警告。预测模型本身可基于历史索赔模式连同DTC模式一起的检测来提供早期警告。使用高级统计方法,模型检查潜在历史欺诈的数据以及构建用于预测由维修中心做出的潜在未来欺诈的数据模型。在高水平处,本文公开的方法可包括下列步骤中的一个或多个:数据理解、清理和处理;数据存储,其存储数据(例如使用HadoopMap-Reduce数据库来便于更快的模型构建和数据提取);在预测欺诈索赔时建立DTC和其它导出的变量的预测能力;关联规则挖掘,其检测引起故障的DTC模式,且不同的汽车零件针对每个索赔被考虑;对欺诈索赔预测的监督和非监督预测模型开发;规则排序方法,其按引起欺诈的倾向来排列索赔模式;开发预测模型,其从训练数据识别是欺诈的索赔模式;在通过使用混淆矩阵从样本数据中识别欺诈索赔时的模型验证;和/或合并智能统计模型,其发现、学习并预测欺诈索赔连同DTC模式。基于使用将在下面更深入地讨论的本文公开的方法执行的实验,得到很多结果。例如,当应用本文所述的方法和系统时,可在实际索赔定局之前以合理的准确度和足够的预先通知发现比正常索赔更经常地导致欺诈的索赔。可从数据中找到索赔模式连同DTC模式,其帮助以合理的准确度预测欺诈索赔。此外,组合数据集如远程信息处理数据、保修数据集、修理命令和远程诊断故障代码(DTC)帮助我们准确地预测欺诈索赔。虽然本公开包括分析在预测欺诈索赔时有用的索赔连同DTC的系统和方法,但本公开还设想以高水平的准确度满足目的。上述目的可由一种方法实现,该方法包括:接收诊断故障代码(DTC)数据和来自车辆的一个或多个参数;基于诊断故障代码数据和一个或多个参数来确定保修欺诈概率;以及响应于保修欺诈概率超过阈值而向操作员指示有可能是欺诈。该方法可提供用于使操作员确定保修索赔何时可能是合法的(非欺诈性的)、可能是欺诈性的和/或何时保修索赔应被发出(例如到索赔分析员)用于进一步审查的鲁棒和有效的方式。该方法还可包括从车辆接收一个或多个以前的DTC,其中该确定进一步基于一个或多个以前的DTC;响应于欺诈保修概率未超过阈值而向操作员指示不太可能是欺诈,其中阈值基于最小化总成本,总成本基于被识别为非欺诈性的保修索赔的成本和被错误地识别为欺诈性的保修索赔的成本。在一些例子中,该指示包括使用包括屏幕的显示装置向操作员显示可读的消息,接收DTC数据和一个或多个参数经由控制器区域网络(CAN)总线执行,和/或该确定基于由一种或多种机器学习技术产生的预测欺诈检测模型。该方法还可规定,预测欺诈检测模型包括随机森林模型,预测欺诈检测模型包括逻辑回归模型,和/或机器学习技术包括k均值聚类、决策树、最大相关度最小冗余度或关联规则挖掘中的至少一个,以及其中机器学习技术在保修索赔数据库上执行。此外,保修索赔数据库可包括历史数据,历史数据包括过去和当前的DTC,DTC包括快照数据、车辆类型、车辆牌子和型号、经销商细节、更换零件信息、工作命令信息或车辆操作参数。在其它例子中,上面的目的可由一种系统实现,该系统包括:通信装置,其配置成与车辆通信;输入装置,其配置成从操作员接收输入;输出装置,其配置成向操作员显示消息;处理器,其包括存储在非临时存储器中的计算机可读指令,计算机可读指令用于:经由通信装置接收多个车辆参数;基于车辆参数来执行预测欺诈检测模型;基于该执行来确定欺诈概率;响应于欺诈概率超过阈值而显示欺诈的指示;以及响应于欺诈概率不超过阈值而显示没有欺诈的指示。在还有其它例子中,上面的目的可由一种方法实现,该方法包括基于多个车辆参数与在历史保修索赔数据中的多个趋势的比较来指示保修的概率。从下面的公开和附图中,另外的优点和实施方案将对本领域技术人员明显。附图说明参考附图,从阅读非限制性实施方案的下面的描述中可更好地理解本公开,其中下面:图1示出根据本公开的一个或多个实施方案的诊断装置的实施方案;图2示出根据本公开的一个或多个实施方案的用于使用预测欺诈检测模型来评估在保修索赔中的欺诈的概率的方法;图3示出根据本公开的一个或多个实施方案的用于产生预测欺诈检测模型的方法;图4通过会话定义示出欺诈性和非欺诈性索赔的流程图;图5示出样本盒须图方法;图6A和6B示出在使用盒须图方法移除数据异常值之前和之后的样本数据集;图7A-7C示出用于在过采样和欠采样技术之后的模型训练与验证的样本数据集;图8示出分层采样技术;图9示出合成少数过采样技术(SMOTE);图10示出用于将连续数据点分箱成离散数据点的样本决策树;图11示出用于非监督机器学习的工作流图;图12示出对k均值聚类算法的拟合度的曲线图;图13示出灵敏度和特异性图;图14示出用于监督机器学习的工作流图;图15示出样本逻辑功能;图16示出随机森林算法的示意图;图17示出用于确定决策阈值的ROC曲线;图18示出用于模型的训练和验证的工作流图;图19A和19B示出随机森林和逻辑回归模型的模型准确度数据。具体实施方式如上面所提到的,提供了用于使用预测欺诈检测模型进行保修欺诈检测的系统和方法。下面是包括如本文使用的术语的定义的表:图1示意性示出根据本公开的教导的诊断装置的示例实施方案。诊断装置100可通过通信耦合142通信地耦合到车辆140,以便接收诊断故障代码(DTC)和相关联信息。DTC可包括在SAE标准J/1939中规定的板载诊断参数ID(OBD-IIPID),或可包括其它标准或非标准DTC。DTC可包括车本文档来自技高网...

【技术保护点】
1.一种方法,包括:接收来自车辆的诊断故障代码(DTC)数据和一个或多个参数;基于所述诊断故障代码数据和所述一个或多个参数来确定保修欺诈概率;以及响应于所述保修欺诈概率超过阈值而向操作员指示有可能是欺诈。

【技术特征摘要】
【国外来华专利技术】2016.09.26 US 62/399,9971.一种方法,包括:接收来自车辆的诊断故障代码(DTC)数据和一个或多个参数;基于所述诊断故障代码数据和所述一个或多个参数来确定保修欺诈概率;以及响应于所述保修欺诈概率超过阈值而向操作员指示有可能是欺诈。2.如权利要求1所述的方法,还包括从所述车辆接收一个或多个以前的DTC,其中所述确定进一步基于所述一个或多个以前的DTC。3.如权利要求1所述的方法,还包括响应于所述欺诈保修概率未超过所述阈值而向所述操作员指示不太可能是欺诈。4.如权利要求1所述的方法,其中所述阈值基于最小化总成本,所述总成本基于被识别为非欺诈性的保修索赔的成本和被错误地识别为欺诈性的保修索赔的成本。5.如权利要求1所述的方法,其中所述指示包括使用包括屏幕的显示装置向所述操作员显示可读的消息。6.如权利要求1所述的方法,其中接收所述DTC数据和一个或多个参数是经由控制器区域网络(CAN)总线执行。7.如权利要求1所述的方法,其中所述确定是基于由一种或多种机器学习技术产生的预测欺诈检测模型。8.如权利要求7所述的方法,其中所述预测欺诈检测模型包括随机森林模型。9.如权利要求7所述的方法,其中所述预测欺诈检测模型包括逻辑回归模型。10.如权利要求7所述的方法,其中所述机器学习技术包括k均值聚类、决策树、最大相关度最小冗余度或关联规则挖掘中的至少一个,以及其中所述机器学习技术在保修索赔数据库上执行。11.如权利要求10所述的方法,其中所述保修索赔数据库包括历史数据,所述历史数据包括过去和当前的DTC,所述DTC包括快照数据、车辆类型、车辆品牌和型号、经销商细节、更换零件信息、工作命令信息或车辆操作参数。12.一种系统,包括:通信装置,其配置成与车辆通信;输入装置,其配置成从操作员接收输入;输出装置,其配置成向所述操作员显示消息;处理器,其包括存储在非临时存储器中的计算...

【专利技术属性】
技术研发人员:N帕特尔G博尔B巴古加
申请(专利权)人:哈曼国际工业有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1