The invention provides a distributed analysis method for policy data, which includes: when the predefined time is reached, the pre-stored policy data are captured from a predefined database; the captured policy data is uploaded directly to HDFS for storage; the policy data stored in HDFS is partitioned based on spark platform to obtain multiple temporary data tables, and The obtained temporary data tables are cached in distributed memory; the policy data in the obtained temporary data tables are analyzed based on the spark platform to obtain the analysis results of the policy change data in all the temporary tables, and the analysis results are returned to the pre-determined terminals. In order to improve the efficiency of policy data analysis, it can quickly analyze the data of policy changes in a large amount of policy data. In addition, the invention also provides an electronic device and a computer readable storage medium.
【技术实现步骤摘要】
电子装置、保单变化数据分布式分析方法及存储介质
本专利技术涉及保单数据处理领域,尤其涉及一种电子装置、保单变化数据分布式分析方法及存储介质。
技术介绍
随着人们保险意识的增强,保险公司的业务类型也变得越来越广泛,通常,保险公司为了准确地了解市场需求并根据市场需求做出对应的发展规划策略,就需要定期统计出保单数据的变化轨迹,也即需要分析筛选出发生变化的保单数据以及保单数据发生变化的原因。目前,要从海量的保单数据中分析筛选出发生变化的保单数据以及保单数据发送变化的原因,需要耗费大量的时间,且在处理过程中容易出现计算机资源耗尽,而无法支持大规模运算的问题。因此,寻求一种快速高效的保单分析方法是亟待解决的问题。
技术实现思路
有鉴于此,本专利技术提出一种电子装置、保单变化数据分布式分析方法及存储介质,能够在海量的保单数据中,快速地分析出保单发生变化的数据,提高保单数据分析的效率。首先,为实现上述目的,本专利技术提出一种电子装置,所述电子装置包括存储器、及与所述存储器连接的处理器,所述处理器用于执行所述存储器上存储的保单变化数据分布式分析程序,所述保单变化数据分布式分析程序被所述处理器执行时实现如下步骤:A1、当达到预定义的时间后,从预先确定的数据库中抓取预先存储的当月保单数据;A2、将抓取的保单数据直接上传至HDFS中进行存储;A3、基于spark平台对存储在HDFS中的保单数据进行分区处理,以得到多个临时数据表,并将得到的多个临时数据表缓存在分布式内存中;A4、基于spark平台对得到的多个临时数据表中的保单数据进行分析,以得到对所有临时表中的保单变化数据的分析结果, ...
【技术保护点】
1.一种电子装置,其特征在于,所述电子装置包括存储器、及与所述存储器连接的处理器,所述处理器用于执行所述存储器上存储的保单变化数据分布式分析程序,所述保单变化数据分布式分析程序被所述处理器执行时实现如下步骤:A1、当达到预定义的时间后,从预先确定的数据库中抓取预先存储的当月保单数据;A2、将抓取的保单数据直接上传至HDFS中进行存储;A3、基于spark平台对存储在HDFS中的保单数据进行分区处理,以得到多个临时数据表,并将得到的多个临时数据表缓存在分布式内存中;A4、基于spark平台对得到的多个临时数据表中的保单数据进行分析,以得到对所有临时表中的保单变化数据的分析结果,将得到的分析结果返回至预先确定的终端。
【技术特征摘要】
1.一种电子装置,其特征在于,所述电子装置包括存储器、及与所述存储器连接的处理器,所述处理器用于执行所述存储器上存储的保单变化数据分布式分析程序,所述保单变化数据分布式分析程序被所述处理器执行时实现如下步骤:A1、当达到预定义的时间后,从预先确定的数据库中抓取预先存储的当月保单数据;A2、将抓取的保单数据直接上传至HDFS中进行存储;A3、基于spark平台对存储在HDFS中的保单数据进行分区处理,以得到多个临时数据表,并将得到的多个临时数据表缓存在分布式内存中;A4、基于spark平台对得到的多个临时数据表中的保单数据进行分析,以得到对所有临时表中的保单变化数据的分析结果,将得到的分析结果返回至预先确定的终端。2.如权利要求1所述的电子装置,其特征在于,所述步骤A3包括:在spark平台中启动spark驱动,并自定义Spark的分区因子;根据自定义的分区数生成RDD,对HDFS文件进行读取,以得到多个临时数据表;将得到的多个临时数据表以RDD形式缓存在分布式内存中。3.如权利要求2所述的电子装置,其特征在于,所述分区因子包括保单数据文件对象,构成保单数据文件对象的数据表的起始位置,构成保单数据文件对象的数据表的长度以及该保单数据文件所在的主机;所述在spark平台中启动spark驱动,并自定义Spark的分区因子的步骤包括:在spark平台中启动spark驱动,构造保单数据文件对象,所述保单数据文件对象包括文件头的开始位置对应的保单号以及文件头的结束位置对应的保单号;基于所述文件头的开始位置对应的保单号和结束位置对于的保单号确定保单数据文件对象的数据表的起始位置、保单数据文件对象的数据表的长度以及该保单数据文件所在的主机。4.如权利要求1所述的电子装置,其特征在于,所述步骤A4包括:分别获取多个临时数据表生成的RDD;基于预定义的保单字段分别遍历存储在RDD中的保单数据,以得到发生变化的保单数据,所述预定义的保单字段包括保单的变化状态,所述保单的变化状态包括脱退单、新增单、状态变化单、信息变化单。5.如权利要求1-4任一所述的电子装置,其特征在于,所述保单信息包括保单标识信息、保单生成时间、保单险种类别、保单变化因子。6.一种保...
【专利技术属性】
技术研发人员:丁志勇,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。