理赔数据的检测方法和装置、电子设备及存储介质制造方法及图纸

技术编号:38277045 阅读:10 留言:0更新日期:2023-07-27 10:28
本申请提供了一种理赔数据的检测方法和装置、电子设备及存储介质,属于人工智能技术领域。方法包括:对目标车辆的待维修项目文本进行数据清洗,得到目标维修项目文本;提取目标维修项目文本的维修项目嵌入特征;基于车辆维修参数和维修项目嵌入特征对目标维修项目文本进行聚类,得到初始维修项目簇群和其平均距离数据,根据平均距离数据对初始维修项目簇群进行簇群优化,得到中间维修项目簇群;对中间维修项目簇群进行外观件检测,得到检测数据;根据检测数据对中间维修项目簇群进行簇群优化,得到目标维修项目簇群和目标聚类中心;基于目标聚类中心对目标维修项目文本进行异常检测,得到异常维修项目文本。本申请能够提高异常检测的准确性。高异常检测的准确性。高异常检测的准确性。

【技术实现步骤摘要】
理赔数据的检测方法和装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种理赔数据的检测方法和装置、电子设备及存储介质。

技术介绍

[0002]车辆保险是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险。
[0003]目前,在车险理赔领域,常常是利用计算机视觉技术和预先拍摄的车辆受损照片来分析车辆的碰撞情况和受损范围,得到车辆的受损数据,从而根据车辆的受损数据来检测对象上报的车辆理赔数据是否存在异常,这一方式会导致异常检测的准确性较差。

技术实现思路

[0004]本申请实施例的主要目的在于提出一种理赔数据的检测方法和装置、电子设备及存储介质,旨在提高异常检测的准确性。
[0005]为实现上述目的,本申请实施例的第一方面提出了一种理赔数据的检测方法,所述方法包括:
[0006]从目标车辆的车辆理赔数据提取待维修项目文本;
[0007]对所述待维修项目文本进行数据清洗,得到目标维修项目文本;
[0008]基于预设的特征图网络对所述目标维修项目文本进行项目特征提取,得到维修项目嵌入特征;
[0009]基于预设的车辆维修参数和所述维修项目嵌入特征对所述目标维修项目文本进行聚类处理,得到多个初始维修项目簇群;
[0010]计算所述初始维修项目簇群的平均距离数据,并根据所述平均距离数据对所述初始维修项目簇群进行簇群优化,得到中间维修项目簇群;
[0011]对所述中间维修项目簇群进行外观件检测,得到检测数据,其中,所述检测数据用于表征存在至少一个所述中间维修项目簇群没有外观件或者表征所述中间维修项目簇群均含有所述外观件;
[0012]根据所述检测数据对所述中间维修项目簇群进行簇群优化,得到目标维修项目簇群和所述目标维修项目簇群的目标聚类中心,其中,每个所述目标维修项目簇群包括至少一个所述外观件;
[0013]基于所述目标聚类中心对所述目标维修项目簇群的目标维修项目文本进行异常检测,得到异常维修项目文本,其中,所述异常维修项目文本用于指示所述车辆理赔数据存在非正常理赔。
[0014]在一些实施例,所述对所述待维修项目文本进行数据清洗,得到目标维修项目文本,包括:
[0015]对所述待维修项目文本进行数据清洗,得到候选维修项目文本;
[0016]基于预设的维修项目映射表对所述候选维修项目文本进行项目筛选,得到所述目标维修项目文本。
[0017]在一些实施例,所述车辆维修参数包括车辆主碰撞点的初始数量,所述基于预设的车辆维修参数和所述维修项目嵌入特征对所述目标维修项目文本进行聚类处理,得到多个初始维修项目簇群,包括:
[0018]根据所述车辆主碰撞点的初始数量,确定初始聚类中心;
[0019]对所述维修项目嵌入特征和每个所述初始聚类中心进行距离计算,得到所述目标维修项目文本的特征距离数据;
[0020]根据所述特征距离数据,将所述目标维修项目文本聚类至所述特征距离数据最小的初始聚类中心所在的簇群,得到所述初始维修项目簇群。
[0021]在一些实施例,所述计算所述初始维修项目簇群的平均距离数据,并根据所述平均距离数据对所述初始维修项目簇群进行簇群优化,得到中间维修项目簇群,包括:
[0022]基于预设公式计算每个所述初始维修项目簇群的平均距离数据;
[0023]对所述平均距离数据进行均值计算,得到目标距离数据;
[0024]根据所述目标距离数据对所述初始聚类中心进行更新,得到中间聚类中心;
[0025]基于所述中间聚类中心对所述初始维修项目簇群进行簇群优化,得到所述中间维修项目簇群。
[0026]在一些实施例,所述根据所述检测数据对所述中间维修项目簇群进行簇群优化,得到目标维修项目簇群和所述目标维修项目簇群的目标聚类中心,包括:
[0027]若所述检测数据表示所述中间维修项目簇群均含有外观件,则将所述中间维修项目簇群作为所述目标维修项目簇群;
[0028]对所述目标维修项目簇群的外观件与维修项目进行相似度检测,得到维修项目相似数据;
[0029]选取所述维修项目相似数据最大的外观件作为所述目标聚类中心。
[0030]在一些实施例,所述根据所述检测数据对所述中间维修项目簇群进行簇群优化,得到目标维修项目簇群和所述目标维修项目簇群的目标聚类中心,包括:
[0031]若所述检测数据表示存在至少一个所述中间维修项目簇群没有外观件,则对所述中间维修项目簇群的中间聚类中心进行更新,并根据所述更新之后的中间聚类中心对所述中间维修项目簇群进行簇群优化,直至所述中间维修项目簇群均包含所述外观件,得到所述目标维修项目簇群;
[0032]对所述目标维修项目簇群的外观件与维修项目进行相似度检测,得到维修项目相似数据;
[0033]选取所述维修项目相似数据最大的外观件作为所述目标聚类中心。
[0034]在一些实施例,所述基于所述目标聚类中心对所述目标维修项目簇群的目标维修项目文本进行异常检测,得到异常维修项目文本,包括:
[0035]获取每个所述目标维修项目文本的维修项目嵌入特征;
[0036]基于所述目标聚类中心对每个所述维修项目嵌入特征进行异常评分,得到异常评分数据;
[0037]比对所述异常评分数据和预设的异常阈值;
[0038]选取所述异常评分数据小于所述异常阈值的目标维修项目文本,得到所述异常维修项目文本。
[0039]为实现上述目的,本申请实施例的第二方面提出了一种理赔数据的检测装置,所述装置包括:
[0040]文本获取模块,用于从目标车辆的车辆理赔数据提取待维修项目文本;
[0041]目标文本确定模块,用于对所述待维修项目文本进行数据清洗,得到目标维修项目文本;
[0042]特征提取模块,用于基于预设的特征图网络对所述目标维修项目文本进行项目特征提取,得到维修项目嵌入特征;
[0043]文本聚类模块,用于基于预设的车辆维修参数和所述维修项目嵌入特征对所述目标维修项目文本进行聚类处理,得到多个初始维修项目簇群;
[0044]第一簇群优化模块,用于计算所述初始维修项目簇群的平均距离数据,并根据所述平均距离数据对所述初始维修项目簇群进行簇群优化,得到中间维修项目簇群;
[0045]外观件检测模块,用于对所述中间维修项目簇群进行外观件检测,得到检测数据,其中,所述检测数据用于表征存在至少一个所述中间维修项目簇群没有外观件或者表征所述中间维修项目簇群均含有所述外观件;
[0046]第二簇群优化模块,用于根据所述检测数据对所述中间维修项目簇群进行簇群优化,得到目标维修项目簇群和所述目标维修项目簇群的目标聚类中心,其中,每个所述目标维修项目簇群包括至少一个所述外观件;
[0047]异常检测模块,用于基于所述目标聚类中心对所述目标维修项目簇群的目标维修项目文本进行异常检测,得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种理赔数据的检测方法,其特征在于,所述方法包括:从目标车辆的车辆理赔数据提取待维修项目文本;对所述待维修项目文本进行数据清洗,得到目标维修项目文本;基于预设的特征图网络对所述目标维修项目文本进行项目特征提取,得到维修项目嵌入特征;基于预设的车辆维修参数和所述维修项目嵌入特征对所述目标维修项目文本进行聚类处理,得到多个初始维修项目簇群;计算所述初始维修项目簇群的平均距离数据,并根据所述平均距离数据对所述初始维修项目簇群进行簇群优化,得到中间维修项目簇群;对所述中间维修项目簇群进行外观件检测,得到检测数据,其中,所述检测数据用于表征存在至少一个所述中间维修项目簇群没有外观件或者表征所述中间维修项目簇群均含有所述外观件;根据所述检测数据对所述中间维修项目簇群进行簇群优化,得到目标维修项目簇群和所述目标维修项目簇群的目标聚类中心,其中,每个所述目标维修项目簇群包括至少一个所述外观件;基于所述目标聚类中心对所述目标维修项目簇群的目标维修项目文本进行异常检测,得到异常维修项目文本,其中,所述异常维修项目文本用于指示所述车辆理赔数据存在非正常理赔。2.根据权利要求1所述的理赔数据的检测方法,其特征在于,所述对所述待维修项目文本进行数据清洗,得到目标维修项目文本,包括:对所述待维修项目文本进行数据清洗,得到候选维修项目文本;基于预设的维修项目映射表对所述候选维修项目文本进行项目筛选,得到所述目标维修项目文本。3.根据权利要求1所述的理赔数据的检测方法,其特征在于,所述车辆维修参数包括车辆主碰撞点的初始数量,所述基于预设的车辆维修参数和所述维修项目嵌入特征对所述目标维修项目文本进行聚类处理,得到多个初始维修项目簇群,包括:根据所述车辆主碰撞点的初始数量,确定初始聚类中心;对所述维修项目嵌入特征和每个所述初始聚类中心进行距离计算,得到所述目标维修项目文本的特征距离数据;根据所述特征距离数据,将所述目标维修项目文本聚类至所述特征距离数据最小的初始聚类中心所在的簇群,得到所述初始维修项目簇群。4.根据权利要求1所述的理赔数据的检测方法,其特征在于,所述计算所述初始维修项目簇群的平均距离数据,并根据所述平均距离数据对所述初始维修项目簇群进行簇群优化,得到中间维修项目簇群,包括:基于预设公式计算每个所述初始维修项目簇群的平均距离数据;对所述平均距离数据进行均值计算,得到目标距离数据;根据所述目标距离数据对所述初始聚类中心进行更新,得到中间聚类中心;基于所述中间聚类中心对所述初始维修项目簇群进行簇群优化,得到所述中间维修项目簇群。
5.根据权利要求1所述的理赔数据的检测方法,其特征在于,所述根据所述检测数据对所述中间维修项目簇群进行簇群优化,得到目标维修项目簇群和所述目标维修项目簇群的目标聚类中心,包括:若所述检测数据表示所述中间维修项目簇群均含有外观件,则将所述中间维修项目簇群作为所述目标维修项目簇群;对所述目标维修项目簇群的外观件与维修项目进行相似度检测,得到维修项目相似数...

【专利技术属性】
技术研发人员:林灿史光辉王建明
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1