【技术实现步骤摘要】
基于大数据的保费数据分析方法、装置及存储介质
本专利技术涉及大数据
,尤其涉及一种基于大数据的保费数据分析方法、装置、电子设备及可读存储介质。
技术介绍
随着大数据的发展,金融保险行业迎来了革命性的变化,金融机构的保费定价开始从人工核算转向了智能化。现有技术中,用于保费定价的数据分析模型,需要通过人工进行筛选操作,包括确定定价计划、决定产品价格以及建立精算假设,通过数据回归算法构造数据分析模型。因此当客户进行投保时,将客户的相关数据输入至数据分析模型中进行分析,需要极大的依赖于人工,导致存在数据分析模型对数据分析精准度不高,进而容易产生保费定价不恰当的问题。
技术实现思路
本专利技术提供一种基于大数据的保费数据分析方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高保费数据分析模型对数据分析的精准度,进而提高保费数据的合理性。为实现上述目的,本专利技术提供的一种基于大数据的保费数据分析方法,包括:获取样本数据集,通过数据挖掘算法对所述样本数据集进行特征分析,得 ...
【技术保护点】
1.一种基于大数据的保费数据分析方法,其特征在于,所述方法包括:/n获取样本数据集,通过数据挖掘算法对所述样本数据集进行特征分析,得到样本特征集,其中,所述样本数据集包含样本用户的数据;/n对所述样本特征集进行过滤,得到过滤数据集;/n对所述过滤数据集进行指标评价,生成保费数据分析模型,其中,所述保费数据分析模型包括划分函数、训练函数、拟合函数;/n获取待分析用户的初始数据集,所述初始数据集包括至少两项保费相关数据集;/n利用所述划分函数分别对所述至少两类保费相关数据集进行特征矩阵划分,得到至少两个特征集;/n利用所述训练函数对所述至少两个特征集进行训练,得到至少两个训练集 ...
【技术特征摘要】 【专利技术属性】
1.一种基于大数据的保费数据分析方法,其特征在于,所述方法包括:
获取样本数据集,通过数据挖掘算法对所述样本数据集进行特征分析,得到样本特征集,其中,所述样本数据集包含样本用户的数据;
对所述样本特征集进行过滤,得到过滤数据集;
对所述过滤数据集进行指标评价,生成保费数据分析模型,其中,所述保费数据分析模型包括划分函数、训练函数、拟合函数;
获取待分析用户的初始数据集,所述初始数据集包括至少两项保费相关数据集;
利用所述划分函数分别对所述至少两类保费相关数据集进行特征矩阵划分,得到至少两个特征集;
利用所述训练函数对所述至少两个特征集进行训练,得到至少两个训练集;
利用所述拟合函数对所述至少两个训练集进行拟合,得到至少两个分析集;
将所述至少两个分析集进行组合,得到对所述用户的保费分析结果。
2.如权利要求1所述的基于大数据的保费数据分析方法,其特征在于,所述通过数据挖掘算法对所述样本数据集进行特征分析,得到样本特征集包括:
将所述样本数据集中的文本和数字进行分组归类,生成文本标签集和数字标签集;
计算所述文本标签集中文本的权重,得到文本权重集;
计算所述数字标签集中数字的权重,得到数字权重集;
将所述文本权重集和所述数字权重集组合,得到样本特征集。
3.如权利要求1所述的基于大数据的保费数据分析方法,其特征在于,所述对所述样本特征集进行过滤,包括:
利用主成分分析法对所述样本特征集进行过滤。
4.如权利要求1所述的基于大数据的保费数据分析方法,其特征在于,所述对所述过滤数据集进行指标评价,包括:
调用均方对数误差函数对所述过滤数据集进行指标评价,所述均方对数误差函数为:
其中,t∈(1,N),N表示所述过滤数据集中的数据总数,yt表示所述过滤数据集中的数据值,ft表示预设的标准值。
5.如权利要求1所述的基于大数据的保费数据分析方法,其特征在于,所述利用所述划分函数分别对所述至少两类保费相关数据集进行特征矩阵划分,得到至少两个特征集包括:
技术研发人员:许家幸,陈真,汪海祥,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。