用于挖掘车险风险因子之间的关联规则的方法和装置制造方法及图纸

技术编号：18785004 阅读：14 留言：0更新日期：2018-08-29 07:24

本发明专利技术提供了一种用于挖掘车险风险因子之间的关联规则的方法，包括以下步骤：步骤S1、根据传统风险因子和车联网新增风险因子，将驾驶者信息和车辆信息进行关联，形成训练样本集；以及步骤S2、使用Apriori算法对训练样本集进行分析，得到传统风险因子和车联网新增风险因子之间具有关联的对象的集合。在本发明专利技术中，对车险行业保险定价相关的传统风险因子和车联网新增风险因子包含的大量变量之间可能存在着的联系，基于大数据分析，应用Apriori算法，得到满足最小支持度数和最小置信度数的关联规则的对象，并提取我们感兴趣的子集用于后续业务分析。

全部详细技术资料下载

【技术实现步骤摘要】
用于挖掘车险风险因子之间的关联规则的方法和装置
本专利技术涉及汽车领域，尤其涉及一种用于挖掘车险风险因子之间的关联规则的方法和装置。
技术介绍
随着城市化的不断深入和推进，城市越来越拥挤，越来越多的家庭拥有了自己的车。在汽车保险中，保险定价的风险分类主要有从人因素、从车因素和道路环境因素。由此各国汽车保险的费率模式基本上可以划分为两大类，即从车费率模式和从人费率模式。从车费率模式是指在确定保险费率的过程中主要以被保险车辆的风险因子作为影响费率确定因素的模式。从车费率模式具有体系简单，易于操作的特点。但是，从车费率模式的缺陷是显而易见的，因为在汽车的使用过程中对于风险的影响起到决定作用的是与车辆驾驶人有关的风险因子。从人费率模式是指在确定保险费率的过程中主要以被保险车辆驾驶人的风险因子作为影响费率确定因素的模式。在从人费率模式中，从人因素包括传统风险因子和车联网新增风险因子。传统风险因子包括：驾驶人年龄、性别、驾龄、交通违章记录等。随着车联网的发展，车辆的驾驶数据可以上传到后台服务器，车联网新增风险因子包括行驶速度的平均值和方差，急加速、急减速和急转弯次数或频率，超速驾驶里程、时长、次数，疲劳驾驶里程、时长、次数，高峰时段驾驶里程、时长、次数，深夜时段驾驶里程、时长、次数，恶劣天气驾驶里程、时长、次数，恶劣路况驾驶里程、时长、次数等。因此，如果能够挖掘两者之间的关联规则，对于保险公司精确计算客户风险、细分客户群体将大有帮助。
技术实现思路
本专利技术的目的在于提供一种用于挖掘车险风险因子之间的关联规则的方法和装置以考察各因子的组合，挖掘之间的关联规则。一方面，本...

【技术保护点】
1.一种用于挖掘车险风险因子之间的关联规则的方法，其特征在于，包括以下步骤：步骤S1、根据传统风险因子和车联网新增风险因子，将驾驶者信息和车辆信息进行关联，形成训练样本集；以及步骤S2、使用Apriori算法对所述训练样本集进行分析，得到所述传统风险因子和所述车联网新增风险因子之间具有关联的对象的集合。

【技术特征摘要】
1.一种用于挖掘车险风险因子之间的关联规则的方法，其特征在于，包括以下步骤：步骤S1、根据传统风险因子和车联网新增风险因子，将驾驶者信息和车辆信息进行关联，形成训练样本集；以及步骤S2、使用Apriori算法对所述训练样本集进行分析，得到所述传统风险因子和所述车联网新增风险因子之间具有关联的对象的集合。2.根据权利要求1所述的用于挖掘车险风险因子之间的关联规则的方法，其特征在于，所述步骤S1包括：步骤S11、将所述驾驶者信息和所述车辆信息进行关联，进行聚合统计操作；步骤S12、以所述驾驶者信息和所述车辆信息为单位，整合车载智能终端上报的数据集、天气数据集、交通违章记录数据集、驾驶者和车辆基本资料数据集、保险公司理赔事宜数据集，形成所述训练样本集。3.根据权利要求2所述的用于挖掘车险风险因子之间的关联规则的方法，其特征在于，在所述步骤S1和所述步骤S2之间还包括：将数值型表示的所述训练样本集转化成布尔型，并用稀疏矩阵表示。4.根据权利要求3所述的用于挖掘车险风险因子之间的关联规则的方法，其特征在于，所述步骤S2包括：步骤S21、设定最小支持度数和最小置信度数；步骤S22、对表示成稀疏矩阵的训练样本集应用Apriori算法获得支持度值，得到满足所述最小支持度数的对象；步骤S23、对满足所述最小支持度数的对象进行Apriori计算，获得置信度值，得到满足所述最小置信度数的对象，并产生相应的关联规则集合；步骤S24、对关联规则集合的对象排序，提取感兴趣的子集进行业务分析。5.一种...

【专利技术属性】
技术研发人员：朱杰，孙家棣，
申请(专利权)人：深圳市赛格车圣智联科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人