基于共性抽取的案件审核方法、装置、设备及存储介质制造方法及图纸

技术编号:23100265 阅读:32 留言:0更新日期:2020-01-14 20:49
本发明专利技术公开了一种基于共性抽取的案件审核方法、装置、设备及存储介质,应用于大数据分析技术领域,用于解决现有自动审核指标设定不准确,容易遗漏虚假理赔案件的问题。本发明专利技术提供的方法包括:确定待审核的目标理赔案件的被保险人;获取被保险人在权威认证机构的材料数据;获取理赔请求时上传的被保险人的各个理赔材料照片;使用图像文字识别技术提取各个理赔材料照片中的理赔材料信息;对比理赔材料信息和材料数据,并确定出材料数据与理赔材料信息之间存在差异的目标差异数据;若目标差异数据中存在预设指定项目的数据,则将目标理赔案件转入人工审核环节;若目标差异数据中不存在预设指定项目的数据,则确定目标理赔案件审核通过。

Method, device, equipment and storage medium of case audit based on common extraction

【技术实现步骤摘要】
基于共性抽取的案件审核方法、装置、设备及存储介质
本专利技术涉及大数据分析
,尤其涉及基于共性抽取的案件审核方法、装置、设备及存储介质。
技术介绍
目前,国内保险公司理赔风控时一般仅对高额理赔案件进行监控,监控手段也较原始,大多采用的是人工调查的手段。随着健康险、小额医疗险等险种的大力推广,保险公司的理赔案件的结构也发生了变化,逐渐开始以门诊就诊的小额理赔案件为主,加上目前保险监督管理委员会对小额理赔案件的理赔时效要求较高,小额理赔案件大多采用自动审核的方式处理。现有自动审核的方式通常由保险人员设定好广泛适用的指标,通过采集理赔材料上这些指标的数值来具体判定理赔案件是否存在潜在风险,即虚假理赔。然而,现有自动审核中指标的设定容易受到人为因素的干扰,出现指标设定不准确或不正确的问题,进而影响自动审核的效果,导致自动审核时遗漏掉虚假理赔案件的情况出现。
技术实现思路
本专利技术实施例提供一种基于共性抽取的案件审核方法、装置、计算机设备及存储介质,以解决现有自动审核指标设定不准确,容易遗漏虚假理赔案件的问题。一种基于共性抽取的案件审核方法,包括:确定待审核的目标理赔案件的被保险人;获取所述被保险人在权威认证机构的材料数据;获取理赔请求时上传的所述被保险人的各个理赔材料照片;使用图像文字识别技术提取所述各个理赔材料照片中的理赔材料信息;对比所述理赔材料信息和所述材料数据,并确定出所述材料数据与所述理赔材料信息之间存在差异的目标差异数据;若所述目标差异数据中存在预设指定项目的数据,则将所述目标理赔案件转入人工审核环节;若所述目标差异数据中不存在预设指定项目的数据,则确定所述目标理赔案件审核通过;其中,所述预设指定项目通过以下步骤预先设定:获取各个历史虚假理赔案件,以及所述各个历史虚假理赔案件的第一差异数据项,所述第一差异数据项是指历史虚假理赔案件中出现差异数据的项目;统计每种所述第一差异数据项在所有历史虚假理赔案件中出现的次数,记为第一次数;对各种第一差异数据项按照第一次数的多少排序,取排序靠前的N种第一差异数据项作为初始项目;获取各个历史真实理赔案件,以及所述各个历史真实理赔案件的第二差异数据项,所述第二差异数据项是指历史真实理赔案件中出现差异数据的项目;统计每种所述第二差异数据项在所有历史真实理赔案件中出现的次数,记为第二次数;对各种第二差异数据项按照第二次数的多少排序,取排序靠前的M种第二差异数据项作为排除项目;从所述初始项目中剔除所述排除项目,得到剩下的项目作为所述预设指定项目。一种基于共性抽取的案件审核装置,包括:被保险人确定模块,用于确定待审核的目标理赔案件的被保险人;材料数据获取模块,用于获取所述被保险人在权威认证机构的材料数据;材料照片获取模块,用于获取理赔请求时上传的所述被保险人的各个理赔材料照片;材料信息提取模块,用于使用图像文字识别技术提取所述各个理赔材料照片中的理赔材料信息;差异数据确定模块,用于对比所述理赔材料信息和所述材料数据,并确定出所述材料数据与所述理赔材料信息之间存在差异的目标差异数据;案件转入模块,用于与若所述目标差异数据中存在预设指定项目的数据,则将所述目标理赔案件转入人工审核环节;审核通过模块,用于若所述目标差异数据中不存在预设指定项目的数据,则确定所述目标理赔案件审核通过;其中,所述预设指定项目通过以下模块预先设定:虚假案件获取模块,用于获取各个历史虚假理赔案件,以及所述各个历史虚假理赔案件的第一差异数据项,所述第一差异数据项是指历史虚假理赔案件中出现差异数据的项目;第一次数统计模块,用于统计每种所述第一差异数据项在所有历史虚假理赔案件中出现的次数,记为第一次数;第一排序模块,用于对各种第一差异数据项按照第一次数的多少排序,取排序靠前的N种第一差异数据项作为初始项目;真实案件获取模块,用于获取各个历史真实理赔案件,以及所述各个历史真实理赔案件的第二差异数据项,所述第二差异数据项是指历史真实理赔案件中出现差异数据的项目;第二次数统计模块,用于统计每种所述第二差异数据项在所有历史真实理赔案件中出现的次数,记为第二次数;第二排序模块,用于对各种第二差异数据项按照第二次数的多少排序,取排序靠前的M种第二差异数据项作为排除项目;项目剔除模块,用于从所述初始项目中剔除所述排除项目,得到剩下的项目作为所述预设指定项目。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于共性抽取的案件审核方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于共性抽取的案件审核方法的步骤。上述基于共性抽取的案件审核方法、装置、计算机设备及存储介质,首先,确定待审核的目标理赔案件的被保险人;然后,获取所述被保险人在权威认证机构的材料数据;接着,获取理赔请求时上传的所述被保险人的各个理赔材料照片;再使用图像文字识别技术提取所述各个理赔材料照片中的理赔材料信息;对比所述理赔材料信息和所述材料数据,并确定出所述材料数据与所述理赔材料信息之间存在差异的目标差异数据;若所述目标差异数据中存在预设指定项目的数据,则将所述目标理赔案件转入人工审核环节;若所述目标差异数据中不存在预设指定项目的数据,则确定所述目标理赔案件审核通过。其中,关于预设指定项目,这些预设指定项目可以通过大数据统计的方式得到,无需人为设置:获取各个历史虚假理赔案件,以及所述各个历史虚假理赔案件的第一差异数据项,所述第一差异数据项是指历史虚假理赔案件中出现差异数据的项目;统计每种所述第一差异数据项在所有历史虚假理赔案件中出现的次数,记为第一次数;对各种第一差异数据项按照第一次数的多少排序,取排序靠前的N种第一差异数据项作为初始项目;获取各个历史真实理赔案件,以及所述各个历史真实理赔案件的第二差异数据项,所述第二差异数据项是指历史真实理赔案件中出现差异数据的项目;统计每种所述第二差异数据项在所有历史真实理赔案件中出现的次数,记为第二次数;对各种第二差异数据项按照第二次数的多少排序,取排序靠前的M种第二差异数据项作为排除项目;从所述初始项目中剔除所述排除项目,得到剩下的项目作为所述预设指定项目。可见,本专利技术实时获取到各大权威认证机构的材料数据,并使用这些材料数据与上报的理赔材料照片中的信息比对,快速区分出上传的理赔材料中存在哪些差异数据,如果这些差异数据中存在预设指定项目的数据,说明该目标理赔案件的理赔材料中针对重要的信息存在隐瞒或伪造的情况,可以认为该目标理赔案件的风险较大,将其转入人工审核环节进行严格风控;反之,则可以确定该目标理赔案件审核通过。其中,本专利技术中的预设指定项目并非人为设定,而是大数据统计的方式得到,并创造性地将统计的数据划分为历史虚假本文档来自技高网...

【技术保护点】
1.一种基于共性抽取的案件审核方法,其特征在于,包括:/n确定待审核的目标理赔案件的被保险人;/n获取所述被保险人在权威认证机构的材料数据;/n获取理赔请求时上传的所述被保险人的各个理赔材料照片;/n使用图像文字识别技术提取所述各个理赔材料照片中的理赔材料信息;/n对比所述理赔材料信息和所述材料数据,并确定出所述材料数据与所述理赔材料信息之间存在差异的目标差异数据;/n若所述目标差异数据中存在预设指定项目的数据,则将所述目标理赔案件转入人工审核环节;/n若所述目标差异数据中不存在预设指定项目的数据,则确定所述目标理赔案件审核通过;/n其中,所述预设指定项目通过以下步骤预先设定:/n获取各个历史虚假理赔案件,以及所述各个历史虚假理赔案件的第一差异数据项,所述第一差异数据项是指历史虚假理赔案件中出现差异数据的项目;/n统计每种所述第一差异数据项在所有历史虚假理赔案件中出现的次数,记为第一次数;/n对各种第一差异数据项按照第一次数的多少排序,取排序靠前的N种第一差异数据项作为初始项目;/n获取各个历史真实理赔案件,以及所述各个历史真实理赔案件的第二差异数据项,所述第二差异数据项是指历史真实理赔案件中出现差异数据的项目;/n统计每种所述第二差异数据项在所有历史真实理赔案件中出现的次数,记为第二次数;/n对各种第二差异数据项按照第二次数的多少排序,取排序靠前的M种第二差异数据项作为排除项目;/n从所述初始项目中剔除所述排除项目,得到剩下的项目作为所述预设指定项目。/n...

【技术特征摘要】
1.一种基于共性抽取的案件审核方法,其特征在于,包括:
确定待审核的目标理赔案件的被保险人;
获取所述被保险人在权威认证机构的材料数据;
获取理赔请求时上传的所述被保险人的各个理赔材料照片;
使用图像文字识别技术提取所述各个理赔材料照片中的理赔材料信息;
对比所述理赔材料信息和所述材料数据,并确定出所述材料数据与所述理赔材料信息之间存在差异的目标差异数据;
若所述目标差异数据中存在预设指定项目的数据,则将所述目标理赔案件转入人工审核环节;
若所述目标差异数据中不存在预设指定项目的数据,则确定所述目标理赔案件审核通过;
其中,所述预设指定项目通过以下步骤预先设定:
获取各个历史虚假理赔案件,以及所述各个历史虚假理赔案件的第一差异数据项,所述第一差异数据项是指历史虚假理赔案件中出现差异数据的项目;
统计每种所述第一差异数据项在所有历史虚假理赔案件中出现的次数,记为第一次数;
对各种第一差异数据项按照第一次数的多少排序,取排序靠前的N种第一差异数据项作为初始项目;
获取各个历史真实理赔案件,以及所述各个历史真实理赔案件的第二差异数据项,所述第二差异数据项是指历史真实理赔案件中出现差异数据的项目;
统计每种所述第二差异数据项在所有历史真实理赔案件中出现的次数,记为第二次数;
对各种第二差异数据项按照第二次数的多少排序,取排序靠前的M种第二差异数据项作为排除项目;
从所述初始项目中剔除所述排除项目,得到剩下的项目作为所述预设指定项目。


2.根据权利要求1所述的基于共性抽取的案件审核方法,其特征在于,所述使用图像文字识别技术提取所述各个理赔材料照片中的理赔材料信息包括:
针对每张理赔材料照片,获取所述每张理赔材料照片的单据类型;
从预设的各个文字识别模板中获取与所述每张理赔材料照片的单据类型对应的目标文字识别模板;
针对所述目标文字识别模板中的每个信息项,根据所述每个信息项在所述目标文字识别模板中的位置和尺寸大小,使用图像文字识别技术对所述每张理赔材料照片上对应位置和尺寸大小的照片区域进行扫描识别,得到所述每个信息项对应的单据文本;
在扫描识别得到每张理赔材料照片中每个信息项对应的单据文本之后,将扫描识别得到的所有信息项以及所述所有信息项对应的单据文本确定为所述理赔材料信息,所述所有信息项至少包括就诊时间、就诊的医疗机构和病理指标。


3.根据权利要求1所述的基于共性抽取的案件审核方法,其特征在于,在将所述目标理赔案件转入人工审核环节之前,还包括:
提取所述目标差异数据中各个预设指定项目的项目差异数据;
针对每个预设指定项目,计算所述每个预设指定项目的项目差异数据与所述理赔材料信息中对应项目数据之间的差值,作为指定项目差值;
确定所述每个预设指定项目的指定项目差值所落入的差值区间;
根据预设的区间分值对应关系确定所述每个预设指定项目的欺诈分值,所述区间分值对应关系记录了各个差值区间与各个欺诈分值之间的对应关系;
根据所述每个预设指定项目的欺诈分值和预设权重计算得到所述每个预设指定项目的单项欺诈值;
根据所述目标差异数据中各个预设指定项目各自的单项欺诈值确定所述目标理赔案件的综合欺诈值;
根据所述综合欺诈值从预设的各个后续审核流程中确定出所述目标理赔案件的后续审核流程,所述各个后续审核流程中至少包括将所述目标理赔案件转入人工审核环节的审核流程。


4.根据权利要求3所述的基于共性抽取的案件审核方法,其特征在于,所述各个后续审核流程包括确定所述目标理赔案件审核通过的审核流程、确定所述目标理赔案件审核不通过的审核流程、以及将所述目标理赔案件转入人工审核环节的审核流程;
所述根据所述综合欺诈值从预设的各个后续审核流程中确定出所述目标理赔案件的后续审核流程包括:
若所述综合欺诈值小于预设的第一阈值,则确定所述目标理赔案件审核通过;
若所述综合欺诈值大于或等于预设的第一阈值、且小于或等于预设的第二阈值,则将所述目标理赔案件转入人工审核环节,所述第二阈值大于所述第一阈值;
若所述综合欺诈值大于预设的第二阈值,则确定所述目标理赔案件审核不通过。


5.根据权利要求1至4中任一项所述的基于共性抽取的案件审核方法,其特征在于,在对比所述理赔材料信息和所述材料数据,并确定出所述材料数据与所述理赔材料信息之间存在差异的目标差异数据之前,还包括:
若所述理赔材料信息中包括发票号,则提取所述理赔材料信息中的各个发票号作为各个目标发票号;
获取所述材料数据中的所有发票号;
检测所述所有发票号中是否包含有所有所述目标发票号;
若检测结果为否,则确...

【专利技术属性】
技术研发人员:龙科家钱慈婳孙剑立
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1