精算数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24995732 阅读:17 留言:0更新日期:2020-07-24 17:58
本发明专利技术提供一种精算数据处理方法、装置、电子设备及存储介质。该方法获取原始配置集,并对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集,达到通过分类识别处理对数据进行有针对性的计算的目的,进一步将所述算法配置集和所述非算法配置集转化为字符串数据集,并解析所述字符串数据集,得到算法规则集和配置信息集,以支持多种编程语言,将所述算法规则集和所述配置信息集进行映射,得到映射算法配置集,并利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果。本发明专利技术结合算法引擎实现了对数据的高效处理。

【技术实现步骤摘要】
精算数据处理方法、装置、电子设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种精算数据处理方法、装置、电子设备及存储介质。
技术介绍
目前,各企业大多采用FISProphet精算软件执行精算。但是,所述FISProphet精算软件没有事先对需要处理的数据进行识别预处理,因此不能有效地区分出算法配置集,则无法进行针对性处理,另外,所述FISProphet精算软件也没有选择合适的算法引擎进行计算,导致计算成本较高,所述FISProphet精算软件的处理性能也存在一定瓶颈,遇到海量的数据就需要分批处理,耗费时间较长。
技术实现思路
鉴于以上内容,有必要提供一种精算数据处理方法、装置、电子设备及存储介质,能够通过分类识别处理对数据进行有针对性的计算,且处理速度更快。一种精算数据处理方法,所述方法包括:获取原始配置集;对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集;将所述算法配置集和所述非算法配置集转化为字符串数据集;解析所述字符串数据集,得到算法规则集和配置信息集;将所述算法规则集和所述配置信息集进行映射,得到映射算法配置集;利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果。根据本专利技术优选实施例,所述对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集包括:构建数据分析函数;基于特征选择算法对所述原始配置集进行特征提取;利用提取的特征对所述原始配置集中的数据进行分类,得到候选类别;利用与所述数据分析函数对应的分类器从所述候选类别中确定所述原始配置集中数据的类别,得到所述算法配置集和所述非算法配置集。根据本专利技术优选实施例,所述构建数据分析函数包括:采用下述公式构建所述数据分析函数:其中,R表示所述数据分析函数,D表示文件内容,L表示类别,表示在所述原始配置集中含有配置类别属性Lj的所有特征组成的集合,WT表示在所述原始配置集中文件名中的特征词的集合,RT(*)表示应用数据分析方法,RB(*)表示传统BOW文件内容表示方法。根据本专利技术优选实施例,所述将所述算法配置集和所述非算法配置集转化为字符串数据集包括:采用无组件多文件上传算法将所述算法配置集和所述非算法配置集转化为字符串数据集。根据本专利技术优选实施例,所述解析所述字符串数据集,得到算法规则集和配置信息集包括:计算所述字符串数据集中的数据与指定数据集中数据的相似度;根据计算的相似度将所述字符串数据集转换为所述算法规则集和所述配置信息集。根据本专利技术优选实施例,所述计算所述字符串数据集中的数据与指定数据集中数据的相似度包括:计算所述字符串数据集中的数据与所述指定数据集中数据的编辑距离;对计算的编辑距离进行归一化处理,得到所述字符串数据集中的数据与指定数据集中数据的相似度。根据本专利技术优选实施例,所述利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果包括:当执行高速模型计算时,采用jexl算法引擎计算所述映射算法配置集中的数据,得到数据处理结果;及/或当执行大数据模型计算时,采用spark算法引擎计算所述映射算法配置集中的数据,得到数据处理结果。一种精算数据处理装置,所述装置包括:获取单元,用于获取原始配置集;处理单元,用于对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集;转化单元,用于将所述算法配置集和所述非算法配置集转化为字符串数据集;解析单元,用于解析所述字符串数据集,得到算法规则集和配置信息集;映射单元,用于将所述算法规则集和所述配置信息集进行映射,得到映射算法配置集;所述处理单元,还用于利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果。根据本专利技术优选实施例,所述处理单元对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集包括:构建数据分析函数;基于特征选择算法对所述原始配置集进行特征提取;利用提取的特征对所述原始配置集中的数据进行分类,得到候选类别;利用与所述数据分析函数对应的分类器从所述候选类别中确定所述原始配置集中数据的类别,得到所述算法配置集和所述非算法配置集。根据本专利技术优选实施例,所述处理单元构建数据分析函数包括:采用下述公式构建所述数据分析函数:其中,R表示所述数据分析函数,T表示分类器函数,D表示文件内容,L表示类别,表示在所述原始配置集中含有配置类别属性Lj的所有特征组成的集合,WT表示在所述原始配置集中文件名中的特征词的集合,RT(D)表示应用数据分析方法,RB(D)表示传统BOW文件内容表示方法。根据本专利技术优选实施例,所述转化单元具体用于:采用无组件多文件上传算法将所述算法配置集和所述非算法配置集转化为字符串数据集。根据本专利技术优选实施例,所述解析单元解析所述字符串数据集,得到算法规则集和配置信息集包括:计算所述字符串数据集中的数据与指定数据集中数据的相似度;根据计算的相似度将所述字符串数据集转换为所述算法规则集和所述配置信息集。根据本专利技术优选实施例,所述解析单元计算所述字符串数据集中的数据与指定数据集中数据的相似度包括:计算所述字符串数据集中的数据与所述指定数据集中数据的编辑距离;对计算的编辑距离进行归一化处理,得到所述字符串数据集中的数据与指定数据集中数据的相似度。根据本专利技术优选实施例,所述处理单元利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果包括:当执行高速模型计算时,采用jexl算法引擎计算所述映射算法配置集中的数据,得到数据处理结果;及/或当执行大数据模型计算时,采用spark算法引擎计算所述映射算法配置集中的数据,得到数据处理结果。一种电子设备,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现所述精算数据处理方法。一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述精算数据处理方法。由以上技术方案可以看出,本专利技术能够获取原始配置集,并对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集,进而通过分类识别处理对数据进行有针对性的计算,进一步将所述算法配置集和所述非算法配置集转化为字符串数据集,并解析所述字符串数据集,得到算法规则集和配置信息集,以支持多种编程语言,将所述算法规则集和所述配置信息集进行映射,得到映射算法配置集,并利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果,结合算法引擎实现对数据的高效处理。附图说明图1是本专利技术精算数据处理方法的较佳实施例的流程本文档来自技高网...

【技术保护点】
1.一种精算数据处理方法,其特征在于,所述方法包括:/n获取原始配置集;/n对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集;/n将所述算法配置集和所述非算法配置集转化为字符串数据集;/n解析所述字符串数据集,得到算法规则集和配置信息集;/n将所述算法规则集和所述配置信息集进行映射,得到映射算法配置集;/n利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果。/n

【技术特征摘要】
1.一种精算数据处理方法,其特征在于,所述方法包括:
获取原始配置集;
对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集;
将所述算法配置集和所述非算法配置集转化为字符串数据集;
解析所述字符串数据集,得到算法规则集和配置信息集;
将所述算法规则集和所述配置信息集进行映射,得到映射算法配置集;
利用算法引擎计算所述映射算法配置集中的数据,得到数据处理结果。


2.如权利要求1所述的精算数据处理方法,其特征在于,所述对所述原始配置集进行分类识别处理,得到所述原始配置集中的算法配置集和非算法配置集包括:
构建数据分析函数;
基于特征选择算法对所述原始配置集进行特征提取;
利用提取的特征对所述原始配置集中的数据进行分类,得到候选类别;
利用与所述数据分析函数对应的分类器从所述候选类别中确定所述原始配置集中数据的类别,得到所述算法配置集和所述非算法配置集。


3.如权利要求2所述的精算数据处理方法,其特征在于,所述构建数据分析函数包括:
采用下述公式构建所述数据分析函数:



其中,R表示所述数据分析函数,D表示文件内容,L表示类别,表示在所述原始配置集中含有配置类别属性Lj的所有特征组成的集合,WT表示在所述原始配置集中文件名中的特征词的集合,RT(*)表示应用数据分析方法,RB(*)表示传统BOW文件内容表示方法。


4.如权利要求1所述的精算数据处理方法,其特征在于,所述解析所述字符串数据集,得到算法规则集和配置信息集包括:
计算所述字符串数据集中的数据与指定数据集中数据的相似度;
根据计算的相似度将所述字符串数据集转换为所述算法规则集和所述配置信息集。


5.如权利要求4所述的精算数据处理方法,其特征在于,所述计算所述字符串数据集中的数据与指定数据集中数据的相似度包括:
计算所述字符串数据集中的数据与所述指定数据集中数据的编辑距离;
对计算的编辑距离进行归一化处理...

【专利技术属性】
技术研发人员:王海平
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1