用于挖掘车险风险因子之间的关联规则的方法和装置制造方法及图纸

技术编号:18785004 阅读:14 留言:0更新日期:2018-08-29 07:24
本发明专利技术提供了一种用于挖掘车险风险因子之间的关联规则的方法,包括以下步骤:步骤S1、根据传统风险因子和车联网新增风险因子,将驾驶者信息和车辆信息进行关联,形成训练样本集;以及步骤S2、使用Apriori算法对训练样本集进行分析,得到传统风险因子和车联网新增风险因子之间具有关联的对象的集合。在本发明专利技术中,对车险行业保险定价相关的传统风险因子和车联网新增风险因子包含的大量变量之间可能存在着的联系,基于大数据分析,应用Apriori算法,得到满足最小支持度数和最小置信度数的关联规则的对象,并提取我们感兴趣的子集用于后续业务分析。

【技术实现步骤摘要】
用于挖掘车险风险因子之间的关联规则的方法和装置
本专利技术涉及汽车领域,尤其涉及一种用于挖掘车险风险因子之间的关联规则的方法和装置。
技术介绍
随着城市化的不断深入和推进,城市越来越拥挤,越来越多的家庭拥有了自己的车。在汽车保险中,保险定价的风险分类主要有从人因素、从车因素和道路环境因素。由此各国汽车保险的费率模式基本上可以划分为两大类,即从车费率模式和从人费率模式。从车费率模式是指在确定保险费率的过程中主要以被保险车辆的风险因子作为影响费率确定因素的模式。从车费率模式具有体系简单,易于操作的特点。但是,从车费率模式的缺陷是显而易见的,因为在汽车的使用过程中对于风险的影响起到决定作用的是与车辆驾驶人有关的风险因子。从人费率模式是指在确定保险费率的过程中主要以被保险车辆驾驶人的风险因子作为影响费率确定因素的模式。在从人费率模式中,从人因素包括传统风险因子和车联网新增风险因子。传统风险因子包括:驾驶人年龄、性别、驾龄、交通违章记录等。随着车联网的发展,车辆的驾驶数据可以上传到后台服务器,车联网新增风险因子包括行驶速度的平均值和方差,急加速、急减速和急转弯次数或频率,超速驾驶里程、时长、次数,疲劳驾驶里程、时长、次数,高峰时段驾驶里程、时长、次数,深夜时段驾驶里程、时长、次数,恶劣天气驾驶里程、时长、次数,恶劣路况驾驶里程、时长、次数等。因此,如果能够挖掘两者之间的关联规则,对于保险公司精确计算客户风险、细分客户群体将大有帮助。
技术实现思路
本专利技术的目的在于提供一种用于挖掘车险风险因子之间的关联规则的方法和装置以考察各因子的组合,挖掘之间的关联规则。一方面,本专利技术实施例提供一种用于挖掘车险风险因子之间的关联规则的方法,包括以下步骤:步骤S1、根据传统风险因子和车联网新增风险因子,将驾驶者信息和车辆信息进行关联,形成训练样本集;以及步骤S2、使用Apriori算法对所述训练样本集进行分析,得到所述传统风险因子和所述车联网新增风险因子之间具有关联的对象的集合。优选地,所述步骤S1包括:步骤S11、将所述驾驶者信息和所述车辆信息进行关联,进行聚合统计操作;步骤S12、以所述驾驶者信息和所述车辆信息为单位,整合车载智能终端上报的数据集、天气数据集、交通违章记录数据集、驾驶者和车辆基本资料数据集、保险公司理赔事宜数据集,形成所述训练样本集。优选地,在所述步骤S1和所述步骤S2之间还包括:将数值型表示的所述训练样本集转化成布尔型,并用稀疏矩阵表示。优选地,所述步骤S2包括:步骤S21、设定最小支持度数和最小置信度数;步骤S22、对表示成稀疏矩阵的训练样本集应用Apriori算法获得支持度值,得到满足所述最小支持度数的对象;步骤S23、对满足所述最小支持度数的对象进行Apriori计算,获得置信度值,得到满足所述最小置信度数的对象,并产生相应的关联规则集合;步骤S24、对关联规则集合的对象排序,提取感兴趣的子集进行业务分析。相应地,本专利技术还提供一种用于挖掘车险风险因子之间的关联规则的装置,包括:训练样本集形成模块,用于根据传统风险因子和车联网新增风险因子,将驾驶者信息和车辆信息进行关联,形成训练样本集;数据分析模块,用于使用Apriori算法对所述训练样本集进行分析,得到所述传统风险因子和所述车联网新增风险因子之间具有关联的对象的集合。优选地,所述训练样本集形成模块包括:处理单元,用于将所述驾驶者信息和所述车辆信息进行关联,进行聚合统计操作;分析单元,用于以所述驾驶者信息和所述车辆信息为单位,整合车载智能终端上报的数据集、天气数据集、交通违章记录数据集、驾驶者和车辆基本资料数据集、保险公司理赔事宜数据集,形成所述训练样本集。优选地,还包括数据处理模块,用于将数值型表示的所述训练样本集转化成布尔型,并用稀疏矩阵表示。优选地,所述数据分析模块包括:设定单元,用于设定最小支持度数和最小置信度数;算法应用单元,用于对表示成稀疏矩阵的训练样本集应用Apriori算法获得支持度值,得到满足所述最小支持度数的对象,还用于对满足所述最小支持度数的对象进行Apriori计算,获得置信度值,得到满足所述最小置信度数的对象,并产生相应的关联规则集合;提取单元,用于对关联规则集合的对象排序,提取感兴趣的子集进行业务分析。实施本专利技术实施例,具有如下有益效果:在本专利技术中,对车险行业保险定价相关的传统风险因子和车联网新增风险因子包含的大量变量之间可能存在着的联系,基于大数据分析,应用Apriori算法,得到满足最小支持度数和最小置信度数的关联规则的对象,并提取我们感兴趣的子集用于后续业务分析。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的用于挖掘车险风险因子之间的关联规则的方法的流程示意图;图2是图1所示的步骤S1中的流程示意图;图3是图1所示的步骤S2中的流程示意图;图4是本专利技术实施例二提供的用于挖掘车险风险因子之间的关联规则的装置的原理图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一本专利技术实施例提供了一种用于挖掘车险风险因子之间的关联规则的方法,参见图1,该用于挖掘车险风险因子之间的关联规则的方法可以包括以下步骤:步骤S1、根据传统风险因子和车联网新增风险因子,将驾驶者信息和车辆信息进行关联,形成训练样本集;具体地,参见图2,在本实施例中,准备初始的训练样本的方法包括以下步骤:步骤S11、将所述驾驶者信息和所述车辆信息进行关联,进行聚合统计操作;步骤S12、以所述驾驶者信息和所述车辆信息为单位,整合车载智能终端上报的数据集、天气数据集、交通违章记录数据集、驾驶者和车辆基本资料数据集、保险公司理赔事宜数据集,形成所述训练样本集。步骤S2、使用Apriori算法对所述训练样本集进行分析,得到所述传统风险因子和所述车联网新增风险因子之间具有关联的对象的集合。Apriori算法是挖掘产生布尔关联规则所需频繁项集的基本算法,该算法利用了一个层次顺序搜索的循环方法来完成频繁项集的挖掘工作。这一循环方法就是利用k-项集来产生(k+1)-项集。Apriori算法利用了一个重要性质,又称为Apriori性质来帮助有效缩小频繁项集的搜索空间。若将传统风险因子和车联网新增风险因子包含的各项因子设为一个集合,每个因子均为一个布尔值(真/假)的变量以描述该因子是否对发生交通事故有影响。因此所有因子针对每次交通事故的产生都能用一个布尔向量来表示。分析相应的布尔向量就可以获得哪些因子是伴随(关联)发生的。因此,在步骤S1和S2之间还包括:将数值型表示的所述训练样本集转化成布尔型,并用稀疏矩阵表示。进一步地,参见图3,在本实施例中,应用Apriori算法进行分析的方法包括以下步骤:步骤S21、设定最本文档来自技高网...

【技术保护点】
1.一种用于挖掘车险风险因子之间的关联规则的方法,其特征在于,包括以下步骤:步骤S1、根据传统风险因子和车联网新增风险因子,将驾驶者信息和车辆信息进行关联,形成训练样本集;以及步骤S2、使用Apriori算法对所述训练样本集进行分析,得到所述传统风险因子和所述车联网新增风险因子之间具有关联的对象的集合。

【技术特征摘要】
1.一种用于挖掘车险风险因子之间的关联规则的方法,其特征在于,包括以下步骤:步骤S1、根据传统风险因子和车联网新增风险因子,将驾驶者信息和车辆信息进行关联,形成训练样本集;以及步骤S2、使用Apriori算法对所述训练样本集进行分析,得到所述传统风险因子和所述车联网新增风险因子之间具有关联的对象的集合。2.根据权利要求1所述的用于挖掘车险风险因子之间的关联规则的方法,其特征在于,所述步骤S1包括:步骤S11、将所述驾驶者信息和所述车辆信息进行关联,进行聚合统计操作;步骤S12、以所述驾驶者信息和所述车辆信息为单位,整合车载智能终端上报的数据集、天气数据集、交通违章记录数据集、驾驶者和车辆基本资料数据集、保险公司理赔事宜数据集,形成所述训练样本集。3.根据权利要求2所述的用于挖掘车险风险因子之间的关联规则的方法,其特征在于,在所述步骤S1和所述步骤S2之间还包括:将数值型表示的所述训练样本集转化成布尔型,并用稀疏矩阵表示。4.根据权利要求3所述的用于挖掘车险风险因子之间的关联规则的方法,其特征在于,所述步骤S2包括:步骤S21、设定最小支持度数和最小置信度数;步骤S22、对表示成稀疏矩阵的训练样本集应用Apriori算法获得支持度值,得到满足所述最小支持度数的对象;步骤S23、对满足所述最小支持度数的对象进行Apriori计算,获得置信度值,得到满足所述最小置信度数的对象,并产生相应的关联规则集合;步骤S24、对关联规则集合的对象排序,提取感兴趣的子集进行业务分析。5.一种...

【专利技术属性】
技术研发人员:朱杰孙家棣
申请(专利权)人:深圳市赛格车圣智联科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1