对象风险预测方法和装置、电子设备及存储介质制造方法及图纸

技术编号:38374143 阅读:8 留言:0更新日期:2023-08-05 17:36
本申请实施例提供了一种对象风险预测方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取样本数据;其中,样本数据是具有样本标签的标注数据;对第一基础信息数据进行编码处理得到信息特征,对样本行为数据进行编码处理得到行为特征;将样本关系网络数据输入至预设的图神经网络模型进行特征提取,得到关系特征;对信息特征、行为特征、关系特征进行特征拼接,得到样本拼接特征;将样本拼接特征输入至预设的初始评估模型进行风险预测,得到初始风险标签;对初始评估模型进行参数调整,得到目标评估模型;将获取到的目标数据输入至目标评估模型进行风险预测,得到目标风险标签。本申请实施例能够提高风险预测的准确性。测的准确性。测的准确性。

【技术实现步骤摘要】
对象风险预测方法和装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种对象风险预测方法和装置、电子设备及存储介质。

技术介绍

[0002]相关技术中,通过逻辑回归评分卡模型、树模型等机器学习模型对用户的个体数据进行建模,以确定该用户风险概率评估结果。但是,上述方法所获取的个体数据对确定用户的变动情况存在一定的局限性,从而影响了风险概率评估结果的准确性。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种对象风险预测方法和装置、电子设备及存储介质,旨在提高风险预测的准确性。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种对象风险预测方法,所述方法包括:获取样本数据;其中,所述样本数据是具有样本标签的标注数据,所述样本标签用于表征样本对象的风险等级类别,所述样本数据包括所述样本对象的第一基础信息数据、所述样本对象的样本行为数据、所述样本对象的样本关系网络数据;
[0005]对所述第一基础信息数据进行编码处理得到信息特征,对所述样本行为数据进行编码处理得到行为特征;
[0006]将所述样本关系网络数据输入至预设的图神经网络模型进行特征提取,得到关系特征;
[0007]对所述信息特征、所述行为特征、所述关系特征进行特征拼接,得到样本拼接特征;
[0008]将所述样本拼接特征输入至预设的初始评估模型进行风险预测,得到初始风险标签;
[0009]根据所述初始风险标签和所述样本标签对所述初始评估模型进行参数调整,得到目标评估模型;
[0010]将获取到的目标数据输入至所述目标评估模型进行风险预测,得到目标风险标签;其中,所述目标数据包括目标对象的目标基础信息数据、所述目标对象的目标行为数据、所述目标对象的目标关系网络数据,所述目标风险标签用于表征所述目标对象的风险等级类别。
[0011]在一些实施例,所述样本标签包括第一正标签和第一负标签,所述第一基础信息数据包括具有所述第一正标签的第一子数据和具有所述第一负标签的第二子数据;
[0012]所述对所述第一基础信息数据进行编码处理得到信息特征,包括:
[0013]对所述第一基础信息数据进行离散化处理,得到多个初始样本信息区间;
[0014]获取其中一个所述初始样本信息区间包含的所述第一子数据的数据量,得到第一子数量;
[0015]获取其中一个所述初始样本信息区间包含的所述第二子数据的数据量,得到第二子数量;
[0016]获取所有所述初始样本信息区间包含的所述第一子数据的数据量,得到第一总数量;
[0017]获取所有所述初始样本信息区间包含的所述第二子数据的数据量,得到第二总数量;
[0018]根据所述第一子数量、所述第二子数量、所述第一总数量、所述第二总数量计算得到所述初始样本信息区间的初始信息量;
[0019]根据所述初始信息量计算得到所有所述初始样本信息区间的总信息量,若所述总信息量在第一预设范围内,则对所述初始样本信息区间进行编码处理得到所述信息特征。
[0020]在一些实施例,所述样本标签包括第一正标签和第一负标签,所述第一基础信息数据包括具有所述第一正标签的第一子数据和具有所述第一负标签的第二子数据;
[0021]所述对所述第一基础信息数据进行编码处理得到信息特征,包括:
[0022]对所述第一基础信息数据进行离散化处理,得到初始样本信息区间;
[0023]获取所述初始样本信息区间包含的第一子数据的数据量,得到第一子数量;
[0024]获取所述初始样本信息区间包含的第二子数据的数据量,得到第二子数量;
[0025]根据所述样本数据的采集时间和预设采样间隔获取验证数据;其中,所述验证数据是具有验证标签的标注数据,所述验证标签用于表征所述样本对象的风险等级类别,所述验证数据包括所述样本对象的第二基础信息数据;所述验证标签包括第二正标签和第二负标签,所述第二基础信息数据包括具有所述第二正标签的第三子数据和具有所述第二负标签的第四子数据;
[0026]对所述第二基础信息数据进行离散化处理,得到验证信息区间;
[0027]获取所述验证信息区间包含的所述第三子数据的数据量,得到第三子数量;
[0028]获取所述验证信息区间包含的所述第四子数据的数据量,得到第四子数量;
[0029]根据所述第一子数量、所述第二子数量、所述第三子数量、所述第四子数量计算得到所述初始样本信息区间的稳定值;
[0030]若所述稳定值在第二预设范围内,则对所述初始样本信息区间进行编码处理得到所述信息特征。
[0031]在一些实施例,所述样本关系网络数据包括对象关联数据和初始设备共用数据,所述关系特征包括对象关系特征和设备关系特征;
[0032]所述将所述关系网络数据输入至预设的图神经网络模型进行特征提取,得到关系特征,包括:
[0033]将所述对象关联数据输入至所述图神经网络模型进行特征提取,得到所述对象关系特征;
[0034]对所述初始设备共用数据进行数据筛选,得到目标设备共用数据;
[0035]将所述目标设备共用数据输入至所述图神经网络模型进行特征提取,得到所述设备关系特征。
[0036]在一些实施例,所述对象关联数据包括具有节点标签的节点数据、关系数据,所述节点标签用于表征节点对象的风险等级类别,所述关系数据用于表示所述节点对象与所述
样本对象的关联关系,节点标签包括第三正标签和第三负标签,所述节点数据包括具有所述第三正标签的第一子节点数据和具有所述第三负标签的第二子节点数据;
[0037]在所述根据所述信息特征、所述行为特征、所述关系特征进行特征拼接,得到样本拼接特征之前,所述方法还包括:
[0038]获取所述关系数据表示直接关联关系的第一子节点数据的数据量,得到第一节点数量;
[0039]获取所述关系数据表示直接关联关系的第二子节点数据的数据量,得到第二节点数量;
[0040]根据所述第一节点数量和所述第二节点数量计算得到第一占比数量;
[0041]获取关系数据表示间接关联关系的第一子节点数据的数据量,得到第三节点数量;
[0042]获取关系数据表示间接关联关系的第二子节点数据的数据量,得到第四节点数量;
[0043]根据所述第三节点数量和所述第四节点数量计算得到第二占比数量;
[0044]根据所述第一占比数量、所述第二占比数量构建占比特征;
[0045]根据所述占比特征更新所述关系特征。
[0046]在一些实施例,所述样本标签包括第一正标签和第一负标签,所述目标拼接特征包括具有所述第一正标签的第一拼接特征和具有所述第一负标签的第二拼接特征;
[0047]在所述将所述样本拼接特征输入至预设的初始评估模型进行风险预测,得到初始风险标签之前,所述方法还包括:
[0048]对所述第一拼接特征进行上采集处理得到扩充本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象风险预测方法,其特征在于,所述方法包括:获取样本数据;其中,所述样本数据是具有样本标签的标注数据,所述样本标签用于表征样本对象的风险等级类别,所述样本数据包括所述样本对象的第一基础信息数据、所述样本对象的样本行为数据、所述样本对象的样本关系网络数据;对所述第一基础信息数据进行编码处理得到信息特征,对所述样本行为数据进行编码处理得到行为特征;将所述样本关系网络数据输入至预设的图神经网络模型进行特征提取,得到关系特征;对所述信息特征、所述行为特征、所述关系特征进行特征拼接,得到样本拼接特征;将所述样本拼接特征输入至预设的初始评估模型进行风险预测,得到初始风险标签;根据所述初始风险标签和所述样本标签对所述初始评估模型进行参数调整,得到目标评估模型;将获取到的目标数据输入至所述目标评估模型进行风险预测,得到目标风险标签;其中,所述目标数据包括目标对象的目标基础信息数据、所述目标对象的目标行为数据、所述目标对象的目标关系网络数据,所述目标风险标签用于表征所述目标对象的风险等级类别。2.根据权利要求1所述的方法,其特征在于,所述样本标签包括第一正标签和第一负标签,所述第一基础信息数据包括具有所述第一正标签的第一子数据和具有所述第一负标签的第二子数据;所述对所述第一基础信息数据进行编码处理得到信息特征,包括:对所述第一基础信息数据进行离散化处理,得到多个初始样本信息区间;获取其中一个所述初始样本信息区间包含的所述第一子数据的数据量,得到第一子数量;获取其中一个所述初始样本信息区间包含的所述第二子数据的数据量,得到第二子数量;获取所有所述初始样本信息区间包含的所述第一子数据的数据量,得到第一总数量;获取所有所述初始样本信息区间包含的所述第二子数据的数据量,得到第二总数量;根据所述第一子数量、所述第二子数量、所述第一总数量、所述第二总数量计算得到所述初始样本信息区间的初始信息量;根据所述初始信息量计算得到所有所述初始样本信息区间的总信息量,若所述总信息量在第一预设范围内,则对所述初始样本信息区间进行编码处理得到所述信息特征。3.根据权利要求1所述的方法,其特征在于,所述样本标签包括第一正标签和第一负标签,所述第一基础信息数据包括具有所述第一正标签的第一子数据和具有所述第一负标签的第二子数据;所述对所述第一基础信息数据进行编码处理得到信息特征,包括:对所述第一基础信息数据进行离散化处理,得到初始样本信息区间;获取所述初始样本信息区间包含的第一子数据的数据量,得到第一子数量;获取所述初始样本信息区间包含的第二子数据的数据量,得到第二子数量;根据所述样本数据的采集时间和预设采样间隔获取验证数据;其中,所述验证数据是
具有验证标签的标注数据,所述验证标签用于表征所述样本对象的风险等级类别,所述验证数据包括所述样本对象的第二基础信息数据;所述验证标签包括第二正标签和第二负标签,所述第二基础信息数据包括具有所述第二正标签的第三子数据和具有所述第二负标签的第四子数据;对所述第二基础信息数据进行离散化处理,得到验证信息区间;获取所述验证信息区间包含的所述第三子数据的数据量,得到第三子数量;获取所述验证信息区间包含的所述第四子数据的数据量,得到第四子数量;根据所述第一子数量、所述第二子数量、所述第三子数量、所述第四子数量计算得到所述初始样本信息区间的稳定值;若所述稳定值在第二预设范围内,则对所述初始样本信息区间进行编码处理得到所述信息特征。4.根据权利要求1所述的方法,其特征在于,所述样本关系网络数据包括对象关联数据和初始设备共用数据,所述关系特征包括对象关系特征和设备关系特征;所述将所述关系网络数据输入至预设的图神经网络模型进行特征提取,得到关系特征,包括:将所述对象关联数据输入至所述图...

【专利技术属性】
技术研发人员:欧阳燕绚易艳肖京王建明张路张静兰
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1