一种保单数据管理方法、系统、设备及存储介质技术方案

技术编号:38385580 阅读:5 留言:0更新日期:2023-08-05 17:41
本发明专利技术属于信息管理技术领域,具体公开了一种保单数据管理方法、系统、设备及存储介质,通过OCR文字识别技术对电子保单进行内容识别,得到保单数据内容,将保单数据内容的各项信息关联相应的结构化标识生成结构化数据表,然后从保单号提取流水编号来确定相应编排规则和加密算法,依据编排规则利用保单号和投保人身份证号编排出加密密钥,再利用加密密钥和加密算法对结构化数据表进行加密处理,得到保单数据加密包来存入数据库相应存档单元。本发明专利技术可以提升保单数据的管理效率和质量,减少人力成本,能有效提升保单数据管理的安全性和规范性,便于后续进行保单数据的高效解密处理和溯源查询。溯源查询。溯源查询。

【技术实现步骤摘要】
一种保单数据管理方法、系统、设备及存储介质


[0001]本专利技术属于信息管理
,具体涉及一种保单数据管理方法、系统、设备及存储介质。

技术介绍

[0002]在保险行业中,电子保单(如寿险、车险等电子保单)的信息提取及归档管理向来都是业务环节的重要组成部分,往往需要将非结构化的保单数据信息录入到相应的系统中,进行结构化的电子档备份和信息管理。目前,各类电子保单的信息管理主要还是依靠人工来提取保单数据,然后直接将提取的数据录入到相应系统中进行存档,这种人工处理方式处理速度慢,效率低,容易出错,并且数据的处理和保存管理过程安全性较低,存在数据泄露的风险。因此,针对当前保险行业信息量庞大且信息多样的保单数据管理需求,亟需一种更加高效、可靠且安全的保单数据管理手段。

技术实现思路

[0003]本专利技术的目的是提供一种保单数据管理方法、系统、设备及存储介质,用以解决现有技术中存在的上述问题。
[0004]为了实现上述目的,本专利技术采用以下技术方案:第一方面,提供一种保单数据管理方法,包括:获取目标电子保单;对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;采用设定的计算方式对流水编号进行计算,得到规则号和算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;
根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
[0005]在一个可能的设计中,所述对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,包括:依次对目标电子保单进行二值化处理、噪声去除处理和倾斜较正处理,得到预处理图像;采用Faster RCNN算法对预处理图像进行文本检测,得到文本检测结果;采用CRNN算法对文本检测结果进行文本识别,并提取出目标电子保单的保单数据内容。
[0006]在一个可能的设计中,所述分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识,包括:将保单号信息关联保单号标识,将保险起止时间信息关联保险时间标识,将保险业务类型信息关联业务类型标识,将保险公司信息关联保险公司标识,将投保人信息关联投保人标识,将受益人信息关联受益人标识,将险种信息关联险种标识。
[0007]在一个可能的设计中,所述结构化数据表为二维数据表,结构化数据表中包含纵向排列的保单号标识、保险时间标识、业务类型标识、保险公司标识、投保人标识、受益人标识和险种标识,且在保单号标识侧面横向罗列保单号信息,在保险时间标识侧面横向罗列保险起止时间信息,在业务类型标识侧面横向罗列保险业务类型信息,在保险公司标识侧面横向罗列保险公司信息,在投保人标识侧面横向罗列投保人信息,在受益人标识侧面横向罗列受益人信息,在险种标识侧面横向罗列险种信息。
[0008]在一个可能的设计中,所述采用设定的计算方式对流水编号进行计算,得到规则号和算法号,包括:提取流水编号的前三位数作为第一数组,提取流水编号的后三位数作为第二数组;将第一数组中的各位数迭代相加求和,得到一位数的规则号,将第二数组中的各位数迭代相加求和,得到一位数的算法号。
[0009]在一个可能的设计中,在根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法前,所述方法还包括:获取第一编辑指令和第二编辑指令;根据第一编辑指令编辑构建各数据编排规则,并将构建好的各数据编排规则关联相应的规则号,根据第二编辑指令编辑构建各加密算法,并将构建好的各加密算法关联相应的算法号;将关联相应规则号的各数据编排规则存入规则库中,将关联相应算法号的各加密算法存入算法库中。
[0010]在一个可能的设计中,所述将第一字符串与第二字符串组合,形成加密密钥,包括:将第一字符串与第二字符串交叉组合,形成加密密钥,使加密密钥中的奇数位字符来源于第一字符串,加密密钥中的偶数位字符来源于第二字符串。
[0011]第二方面,提供一种保单数据管理系统,包括获取单元、识别单元、标识单元、生成
单元、提取单元、调取单元、组合单元、加密单元和存档单元,其中:获取单元,用于获取目标电子保单;识别单元,用于对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;标识单元,用于分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;生成单元,用于根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;提取单元,用于从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;调取单元,用于采用设定的计算方式对流水编号进行计算,得到规则号和算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;组合单元,用于根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;加密单元,用于根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;存档单元,用于根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
[0012]第三方面,提供一种保单数据管理设备,包括:存储器,用于存储指令;处理器,用于读取所述存储器中存储的指令,并根据指令执行上述第一方面中任意一种所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种保单数据管理方法,其特征在于,包括:获取目标电子保单;对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;采用设定的计算方式对流水编号进行计算,得到规则号和算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。2.根据权利要求1所述的一种保单数据管理方法,其特征在于,所述对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,包括:依次对目标电子保单进行二值化处理、噪声去除处理和倾斜较正处理,得到预处理图像;采用Faster RCNN算法对预处理图像进行文本检测,得到文本检测结果;采用CRNN算法对文本检测结果进行文本识别,并提取出目标电子保单的保单数据内容。3.根据权利要求1所述的一种保单数据管理方法,其特征在于,所述分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识,包括:将保单号信息关联保单号标识,将保险起止时间信息关联保险时间标识,将保险业务类型信息关联业务类型标识,将保险公司信息关联保险公司标识,将投保人信息关联投保人标识,将受益人信息关联受益人标识,将险种信息关联险种标识。4.根据权利要求3所述的一种保单数据管理方法,其特征在于,所述结构化数据表为二维数据表,结构化数据表中包含纵向排列的保单号标识、保险时间标识、业务类型标识、保险公司标识、投保人标识、受益人标识和险种标识,且在保单号标识侧面横向罗列保单号信息,在保险时间标识侧面横向罗列保险起止时间信息,在业务类型标识侧面横向罗列保险业务类型信息,在保险公司标识侧面横向罗列保险公司信息,在投保人标识侧面横向罗列
投保人信息,在受益人标识侧面横向罗列受益人信息,在险种标识侧面横向罗列险种信息。5.根据权利要求1所述的一种保单数据管理方法,其特征在于,所述采用设定的计算方式对流水编号进行计算,得到规则号和算法号,包括:提取流水编号的前三位数作为第一数组,提取流水编号的后三位数作...

【专利技术属性】
技术研发人员:付斌
申请(专利权)人:北京码动摩登科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1