一种数据修正方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34566053 阅读:22 留言:0更新日期:2022-08-17 12:55
本申请实施例属于人工智能中的数据处理技术领域,涉及一种基于家庭关系网络的数据修正方法、装置、计算机设备及存储介质。当需要对某一用户进行数据修正时,本申请通过在保单业务系统中获取与该用户相对应的历史保单数据,并抽取该历史保单数据的核心实体数据,再根据该核心实体数据构建与该用户密切关联的家庭关系网络,在获得该用户的家庭关系网络之后,根据该家庭关系网络对该用户的数据进行修正,由于该保单业务系统中的数据本身具备真实性和可用性,使得构建出来的家庭关系网络也具备真实性和可用性,从而保证后续数据修正的有效性,有效解决传统数据修正方法准确性较低、可用性不高的问题。用性不高的问题。用性不高的问题。

【技术实现步骤摘要】
一种数据修正方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能中的数据处理
,尤其涉及一种基于家庭关系网络的数据修正方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着互联网的快速发展,产品营销行业越来越依赖用户的数据信息,用户数据质量的好坏直接影响应用该数据进行营销的结果,用户数据成为了挖掘用户潜在价值的首要依据,然而,现有的用户数据由于早期各方面原因导致该数据信息存在错误或缺失等问题,进而直接影响后期预测结果、营销策略等,由此可见,如何针对现有的用户数据进行修正成为至关重要的问题。
[0003]现有一种数据修正方法,即采用值填充的方式进行数据修正,具体的,连续型的数据通常用均值、众数、中位数、零值等填充;离散型的数据通常结合业务用指定的值填充,从而实现数据修正的目的。
[0004]然而,申请人发现传统的数据修正方法是基于数据之间的连续性或者离散性特征进行填充,无法反映真实的数据特征,从而导致修正后的数据准确性较低、可用性不高的问题。

技术实现思路

[0005]本申请实施例的目的在于提出一种基于家庭关系网络的数据修正方法、装置、计算机设备及存储介质,以解决传统的数据修正方法存在数据准确性较低、可用性不高的问题。
[0006]为了解决上述技术问题,本申请实施例提供一种基于家庭关系网络的数据修正方法,采用了如下所述的技术方案:
[0007]接收携带有待修正用户标识的待修正数据;
[0008]调用业务系统,在所述业务系统中获取与所述待修正用户标识相对应的历史保单数据;
[0009]对所述历史保单数据进行实体抽取操作,得到实体文本数据以及实体类型数据;
[0010]对所述实体文本数据以及所述实体类型数据进行融合操作,得到实体融合数据;
[0011]对所述历史保单数据进行向量转换操作,得到保单向量数据;
[0012]分别将所述保单向量数据以及所述实体融合数据输入至语言表征模型进行摘要编码操作,得到摘要编码数据,其中,所述语言表征模型由12层Transformers的Encoder模块叠加而成,所述Encoder模块的多头注意力层和前馈神经网络层之间设置有词

实体交叉注意力层;
[0013]对所述摘要编码数据进行解码操作,得到目标保单摘要;
[0014]根据所述目标保单摘要构建与所述待修正用户标识相对应的用户关系网络;
[0015]根据所述用户关系网络对所述待修正数据进行数据修正操作。
[0016]为了解决上述技术问题,本申请实施例还提供一种基于家庭关系网络的数据修正装置,采用了如下所述的技术方案:
[0017]待修正数据获取模块,用于接收携带有待修正用户标识的待修正数据;
[0018]历史数据获取模块,用于调用业务系统,在所述业务系统中获取与所述待修正用户标识相对应的历史保单数据;
[0019]实体抽取模块,用于对所述历史保单数据进行实体抽取操作,得到实体文本数据以及实体类型数据;
[0020]融合模块,用于对所述实体文本数据以及所述实体类型数据进行融合操作,得到实体融合数据;
[0021]向量转换模块,用于对所述历史保单数据进行向量转换操作,得到保单向量数据;
[0022]摘要编码模块,用于分别将所述保单向量数据以及所述实体融合数据输入至语言表征模型进行摘要编码操作,得到摘要编码数据,其中,所述语言表征模型由12层Transformers的Encoder模块叠加而成,所述Encoder模块的多头注意力层和前馈神经网络层之间设置有词

实体交叉注意力层;
[0023]解码模块,用于对所述摘要编码数据进行解码操作,得到目标保单摘要;
[0024]关系网络构建模块,用于根据所述目标保单摘要构建与所述待修正用户标识相对应的用户关系网络;
[0025]数据修正模块,用于根据所述用户关系网络对所述待修正数据进行数据修正操作。
[0026]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0027]包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的基于家庭关系网络的数据修正方法的步骤。
[0028]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
[0029]所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的基于家庭关系网络的数据修正方法的步骤。
[0030]本申请提供了一种基于家庭关系网络的数据修正方法,包括:接收携带有待修正用户标识的待修正数据;调用业务系统,在所述业务系统中获取与所述待修正用户标识相对应的历史保单数据;对所述历史保单数据进行实体抽取操作,得到实体文本数据以及实体类型数据;对所述实体文本数据以及所述实体类型数据进行融合操作,得到实体融合数据;对所述历史保单数据进行向量转换操作,得到保单向量数据;分别将所述保单向量数据以及所述实体融合数据输入至语言表征模型进行摘要编码操作,得到摘要编码数据,其中,所述语言表征模型由12层Transformers的Encoder模块叠加而成,所述Encoder模块的多头注意力层和前馈神经网络层之间设置有词

实体交叉注意力层;对所述摘要编码数据进行解码操作,得到目标保单摘要;根据所述目标保单摘要构建与所述待修正用户标识相对应的用户关系网络;根据所述用户关系网络对所述待修正数据进行数据修正操作。与现有技术相比,本申请通过在保单业务系统中获取与该用户相对应的历史保单数据,并抽取该历史保单数据的核心实体数据,再根据该核心实体数据构建与该用户密切关联的家庭关系网
络,在获得该用户的家庭关系网络之后,根据该家庭关系网络对该用户的数据进行修正,由于该保单业务系统中的数据本身具备真实性和可用性,使得构建出来的家庭关系网络也具备真实性和可用性,从而保证后续数据修正的有效性,有效解决传统数据修正方法准确性较低、可用性不高的问题。
附图说明
[0031]为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1是本申请可以应用于其中的示例性系统架构图;
[0033]图2是本申请实施例一提供的基于家庭关系网络的数据修正方法的实现流程图;
[0034]图3是本申请实施例一提供的保单的一种具体示意图;
[0035]图4是本申请实施例一提供的家庭关系图的一种具体示意图;
[0036]图5是图2中步骤S04的一种具体实施方式的流程图;
[0037]图6是本申请实施例一提供的家庭网络关系的一种具体示意图;
...

【技术保护点】

【技术特征摘要】
1.一种基于家庭关系网络的数据修正方法,其特征在于,包括下述步骤:接收携带有待修正用户标识的待修正数据;调用业务系统,在所述业务系统中获取与所述待修正用户标识相对应的历史保单数据;对所述历史保单数据进行实体抽取操作,得到实体文本数据以及实体类型数据;对所述实体文本数据以及所述实体类型数据进行融合操作,得到实体融合数据;对所述历史保单数据进行向量转换操作,得到保单向量数据;分别将所述保单向量数据以及所述实体融合数据输入至语言表征模型进行摘要编码操作,得到摘要编码数据,其中,所述语言表征模型由12层Transformers的Encoder模块叠加而成,所述Encoder模块的多头注意力层和前馈神经网络层之间设置有词

实体交叉注意力层;对所述摘要编码数据进行解码操作,得到目标保单摘要;根据所述目标保单摘要构建与所述待修正用户标识相对应的用户关系网络;根据所述用户关系网络对所述待修正数据进行数据修正操作。2.根据权利要求1所述的基于家庭关系网络的数据修正方法,其特征在于,所述根据所述用户关系网络对所述待修正数据进行数据修正操作的步骤,具体包括下述步骤:若所述待修正数据的婚姻状态为缺失状态时,则获取与所述待修正用户标识相对应的子女用户数据;判断所述用户关系网络中是否存在与所述子女用户数据相对应的父母用户数据;若存在父母用户数据,则将所述婚姻状态修正为已婚状态,并对所述父母用户数据增设夫妻关联关系;若仅存在所述待修正数据,则将所述婚姻状态修正为未婚状态。3.根据权利要求1所述的基于家庭关系网络的数据修正方法,其特征在于,所述根据所述用户关系网络对所述待修正数据进行数据修正操作的步骤,具体包括下述步骤:若所述待修正数据存在若干个唯一关联关系时,获取与所述待修正用户标识存在所述唯一关联关系的所有关联用户数据;在所述关联用户数据中获取保单承保时间最早的关联用户数据;仅建立所述待修正用户标识与所述保单承保时间最早的关联用户数据相对应的所述唯一关联关系。4.根据权利要求1所述的基于家庭关系网络的数据修正方法,其特征在于,所述目标保单摘要包括投保人信息、被保人信息和受益人信息中的至少一个,所述根据所述目标保单摘要构建与所述待修正用户标识相对应的用户关系网络的步骤,具体包括下述步骤:提取所述每个目标保单摘要的投保人信息、被保人信息和受益人信息,以及每个所述目标保单摘要中的投保人信息、被保人信息和受益人信息的第一初始家庭关系;分别以每个目标保单摘要中的投保人信息、被保人信息和受益人信息作为匹配维度,与其他所述目标保单摘要进行两两匹配,得到匹配结果;根据所述匹配结果,筛选出匹配维度相同的目标保单摘要,得到至少两个第一保单数据集;提取每个所述第一保单数据集中各目标保单摘要的第一初始家庭关系,并基于所述第
一初始家庭关系构建第二初始家庭关系;根据所有所述第二初始家庭关系构建出所有目标保单摘要的家庭关系网络,得到所述用户关系网络。5.根据权利要求4所述的基于家庭关系网络的数据修正方法,其特征在于,所述提取所述每个目标保单摘要的投保人信息、被保人信息和受益人信息,以及每个所述目标保单摘要中的投保人信息、被保人信息和受益人信息的第一初始家庭关系的步骤,具体包括下述步骤:将所述保单数据集中每个目标保...

【专利技术属性】
技术研发人员:黄移军
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1