保险欺诈识别的数据处理方法、装置、设备及服务器制造方法及图纸

技术编号:18553838 阅读:25 留言:0更新日期:2018-07-28 10:53
本说明书实施例公开了一种保险欺诈识别的数据处理方法、装置、设备及服务器,基于投保人员和被保险人的多维度的关系关联数据构建人群的多度关系网络图数据,可以更加深入的挖掘人员之间的关系网络,提高识别效率和范围。同时结合骗保人员自身的特征数据,共同建立有监督的学习模型,用来学习骗保人员的关系网络特征和自身特征。团伙的骗保人员不仅在关系网络上有着较为明显和多度的关系特征,其自身特征也常常表现出相似性,因此利用本说明书实施例提供的方法可以更加有效和高效的识别出骗保人员,提高识别处理效率。

【技术实现步骤摘要】
保险欺诈识别的数据处理方法、装置、设备及服务器
本说明书实施例方案属于保险反欺诈识别的计算机数据处理的
,尤其涉及一种保险欺诈的数据处理方法、装置、处理设备及服务器。
技术介绍
保险是通过缴纳规定的保费,然后可以享受的财务、人身等保障。随着社会的经济发展和人们保险意识的提高,保险业务的需求也越来越多。然而,由于保险有一定的经济杠杆效应,使得市场上出现大量骗保的行为,这些骗保人员通常故意制造保险事并依此获得保险公司赔款。目前的骗保行为有发展为专业化、团队化的趋势,对保险行业的健康发展带来非常不利的影响,损坏保险公司和公众利益。目前传统的识别骗保的方式主要依靠任人工利用一些简单规则对历史骗保人员进行识别,凭借历史骗保人员的行为预测是否存在骗保风险。由于骗保人员和团体的隐蔽性越来越强,现有的这种方式不容易快速发现团体作案,并且人工审核的工作量较大,识别效率较为低下。因此,业内亟需一种可以更加有效和高效的识别出骗保人员的处理方式。
技术实现思路
本说明书实施例目的在于提供一种保险欺诈的数据处理方法、装置、处理设备及服务器,可以提供利用人员之间的关系网络数据和自身特征,可以更加有效的识别出骗保人员。本说明书实施例提供的一种保险欺诈的数据处理方法、装置、处理设备及服务器是包括以下方式实现的:获取待识别人群的关系关联数据;基于所述关系关联数据构建所述待识别人群的多度关系网络图数据以及提取所述待识别人群的人员特征数据;利用构建的有监督学习算法对所述待识别人群的多度关系网络图数据和所述人员特征数据进行识别,确所述待识别人群骗保输出结果;所述有监督学习算法包括采用以选取的目标人群的多度关系网络数据和人员特征数据、打标的历史骗保人员作为样本数据进行训练得到的数据关系模型。一种保险欺诈识别的数据处理装置,包括:数据获取模块,用于获取待识别人群的关系关联数据;特征计算模块,用于基于所述关系关联数据构建所述待识别人群的多度关系网络图数据以及提取所述待识别人群的人员特征数据;欺诈识别模块,用于利用构建的有监督学习算法对所述待识别人群的多度关系网络图数据和所述人员特征数据进行识别,确所述待识别人群骗保输出结果;所述有监督学习算法包括采用以选取的目标人群的多度关系网络数据和人员特征数据、打标的历史骗保人员作为样本数据进行训练得到的数据关系模型。一种处理设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:获取待识别人群的关系关联数据;基于所述关系关联数据构建所述待识别人群的多度关系网络图数据以及提取所述待识别人群的人员特征数据;利用构建的有监督学习算法对所述待识别人群的多度关系网络图数据和所述人员特征数据进行识别,确所述待识别人群骗保输出结果;所述有监督学习算法包括采用以选取的目标人群的多度关系网络数据和人员特征数据、打标的历史骗保人员作为样本数据进行训练得到的数据关系模型。一种服务器,包括至少一个处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:获取待识别人群的关系关联数据;基于所述关系关联数据构建所述待识别人群的多度关系网络图数据以及提取所述待识别人群的人员特征数据;利用构建的有监督学习算法对所述待识别人群的多度关系网络图数据和所述人员特征数据进行识别,确所述待识别人群骗保输出结果;所述有监督学习算法包括采用以选取的目标人群的多度关系网络数据和人员特征数据、打标的历史骗保人员作为样本数据进行训练得到的数据关系模型。本说明书实施例提供的一种保险欺诈的数据处理方法、装置、处理设备及服务器,基于投保人员和被保险人的多维度的关系关联数据构建人群的多度关系网络图数据,可以更加深入的挖掘人员之间的关系网络,提高识别效率和范围。同时结合骗保人员自身的特征数据,共同建立有监督的学习模型,用来学习骗保人员的关系网络特征和自身特征。团伙的骗保人员不仅在关系网络上有着较为明显和多度的关系特征,其自身特征也常常表现出相似性,因此利用本说明书实施例提供的方法可以更加有效和高效的识别出骗保人员,提高识别处理效率。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本说明书提供的一种保险欺诈识别的数据处理方法实施例的流程示意图;图2是本说明书提供的一种构建有监督识别模型的处理过程示意图;图3是本说明书提供的一种保险欺诈识别处理服务器的硬件结构框图;图4是本说明书提供的一种保险欺诈识别的数据处理装置的模块结构示意图。图5是本说明书提供的一种保险欺诈识别的数据处理装置中欺诈识别模块的模块结构示意图。具体实施方式为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书中的一部分实施例,而不是全部的实施例。基于本说明书中的一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书实施例保护的范围。物以类聚,人以群分。骗保人群通常需要多人配合才能提高骗保的伪装性。而骗保人员的聚集在很多情况下也会基于熟人关系或具有较为明显的共性特征或某一维度的网络关系特征数据。例如以亲戚之间合伙的骗保行为,传销性质的具有明显阶层划分的骗保团体、有经验的历史骗保人员为头目拉拢的社会群体或学生群体等。本说明书实施例提供多个实施方案中,从包含投保人员和申请理赔人员的目标人群的多种关系关联数据触发,进行多度关系网络的构图(关系网络图的数据可以称为多度关系图数据),深入挖掘目标人群之间的关系网络,解决有常规仅对历史骗保人员和与历史骗保人员有直接关系的一度关系进行识别的覆盖率和识别率低的问题。同时,本说明书实施例提供的方案,还考虑到骗保人员自身的特征属性,如骗保人员通常使用虚假信息注册账号、账号注册时间短、账号注册后主使用投保业务等。本说明书提供的实施方案,结合骗保团体的关系特征数据和自身特征数据,将历史骗保人员标记出来,进行有监督模型的算法学习,从而可以计算或识别出待识别人群是否存在骗保的结果。下面以一个具体的保险业务欺诈识别处理的应用场景为例对本说明书实施方案进行说明。具体的,图1是本说明书提供的所述一种保险欺诈识别的数据处理方法实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。当然,下述实施例的描述并不对基于本说明书的其他可扩展到的技术方案构成限制。例如其他的实施场景中,本本文档来自技高网
...

【技术保护点】
1.一种保险欺诈识别的数据处理方法,所述方法包括:获取待识别人群的关系关联数据;基于所述关系关联数据构建所述待识别人群的多度关系网络图数据以及提取所述待识别人群的人员特征数据;利用构建的有监督学习算法对所述待识别人群的多度关系网络图数据和所述人员特征数据进行识别,确所述待识别人群骗保输出结果;所述有监督学习算法包括采用以选取的目标人群的多度关系网络数据和人员特征数据、打标的历史骗保人员作为样本数据进行训练得到的数据关系模型。

【技术特征摘要】
1.一种保险欺诈识别的数据处理方法,所述方法包括:获取待识别人群的关系关联数据;基于所述关系关联数据构建所述待识别人群的多度关系网络图数据以及提取所述待识别人群的人员特征数据;利用构建的有监督学习算法对所述待识别人群的多度关系网络图数据和所述人员特征数据进行识别,确所述待识别人群骗保输出结果;所述有监督学习算法包括采用以选取的目标人群的多度关系网络数据和人员特征数据、打标的历史骗保人员作为样本数据进行训练得到的数据关系模型。2.如权利要求1所述的方法,所述关系关联数据包括下述中的至少一种:社会关系数据、终端数据、终端的应用以及应用账户操作信息、与保险行为关联的行为数据、人员基础属性数据、地理位置数据。3.如权利要求1所述的方法,所述确所述待识别人群骗保输出结果包括输出单个待识别目标人员是否为欺诈人员或为欺诈人员的概率。4.如权利要求1所述的方法,所述选取的目标人群包括申请理赔人员和被保险人的人员集合。5.如权利要求1或3中任意一项所述的方法,所述人员特征数据包括用户注册账号、交易数据、与保险行为关联的行为数据中的至少一项提取出来的特征数据。6.如权利要求1或3中任意一项所述的方法,所述采用下述方式构建有监督学习算法包括:利用选取的有监督学习算法对目标人群的多度关系网络数据中目标人员与其他人员的关系特征进行第一关系网络学习、基于所述目标人员特征的自身特征数据进行第二自身属性学习;以所述第一关系网学习和第二自身属性学习得到的特征数据作为所述有监督学习算法的自变量,以打标的历史骗保人员作为因变量建立关系模型;在所述关系模型的输出达到预设准确率时确定构建的有监督学习算法。7.一种保险欺诈识别的数据处理装置,包括:数据获取模块,用于获取待识别人群的关系关联数据;特征计算模块,用于基于所述关系关联数据构建所述待识别人群的多度关系网络图数据以及提取所述待识别人群的人员特征数据;欺诈识别模块,用于利用构建的有监督学习算法对所述待识别人群的多度关系网络图数据和所述人员特征数据进行识别,确所述待识别人群骗保输出结果;所述有监督学习算法包括采用以选取的目标人群的多度关系网络数据和人员特征数据、打标的历史骗保人员作为样本数据进行训练得到的数据关系模型。8.如权利要求7所述的装置,其中,所述关系关联数...

【专利技术属性】
技术研发人员:王修坤邹晓川
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1