一种基于不平衡数据集的风险等级识别方法及装置制造方法及图纸

技术编号：40870970 阅读：4 留言：0更新日期：2024-04-08 16:38

本申请公开了一种基于不平衡数据集的风险等级识别方法及装置，用以解决现有的风险检测模型与不平衡数据集不匹配，导致风险识别效果较差的问题。该方法包括：获取目标用户的个人数据集以及风险检测模型；风险检测模型是采用多个已知安全等级的用户的个人数据集作为输入、采用每个用户的安全等级作为输出进行训练得到的；风险检测模型包括多条预测分支和一条动态权重生成分支；风险检测模型的训练过程中，每次迭代是通过模型损失函数同步调整每条预测分支和动态权重生成分支的参数；将目标用户的个人数据集输入到风险检测模型中，基于多条预测分支分别输出的风险得分以及动态权重生成分支输出的每条预测分支对应的权重，确定目标用户的风险等级。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及网络安全，尤其涉及一种基于不平衡数据集的风险等级识别方法及装置。

技术介绍

1、当前信息技术高速发展，在人与互联网交互的过程中，大量的个人的信息数据被记录下来，比如包括表征用户的生活习惯、社会地位、教育水平、经济状况以及个人性格的数据。这些数据的记录与分析有助于深入理解用户需求和行为，帮助企业和组织进行个性化服务和精准营销等业务活动。比如，随着网络购物和信用消费等信息时代的新型消费模式的发展，银行等管理单位可以及时分析个人数据集，评估每个用户的风险等级，更好地理解用户并提高风险治理水平。但是个人数据集中包含多种维度的数据，存在数据不均衡的问题。因此引入应用了多种定量的风险评估模型识别用户的风险等级的效果较差。

2、因此，目前亟需一种针对不平衡数据集的风险等级检测方法。

技术实现思路

1、本申请示例性的实施方式中提供一种基于不平衡数据集的风险等级识别方法及装置，用以解决现有的风险检测模型与不平衡数据集不匹配，导致风险识别效果较差的问题。

2、第一方面，本申请实施例提出了一种基于不平衡数据集的风险等级识别方法，包括：

3、获取目标用户的个人数据集以及风险检测模型；所述风险检测模型是采用多个已知安全等级的用户的个人数据集作为输入，以及采用每个用户的安全等级作为输出进行训练得到的；所述风险检测模型包括多条预测分支和一条动态权重生成分支；在所述风险检测模型的训练过程中，每次迭代是通过模型损失函数同步调整每条预测分支和所述动态权重生成分支的参数；</p>

4、将目标用户的个人数据集输入到风险检测模型中，基于所述多条预测分支分别输出的风险得分以及所述动态权重生成分支输出的每条预测分支对应的权重，确定所述目标用户的风险等级。

5、在一些实施例中，所述基于所述多条预测分支分别输出的风险得分以及所述动态权重生成分支输出的每条预测分支对应的权重，确定所述目标用户的风险等级，包括：

6、采用所述每条预测分支对应的权重对所述每条预测分支输出的风险得分进行加权计算，并基于计算结果确定所述模型损失函数的函数值；

7、根据所述函数值调整所述每条预测分支对应的权重，以及调整所述每条预测分支输出的风险得分，并重新计算所述函数值；

8、当所述函数值满足预设条件时，采用所述每条预测分支对应的权重和所述每条预测分支输出的风险得分，确定所述目标用户的风险等级。

9、在一些实施例中，在将目标用户的个人数据集输入到风险检测模型之前，所述方法还包括：

10、对所述个人数据集中包括的数据进行设定程度的数据扰动处理。

11、在一些实施例中，输入到不同预测分支的数据的扰动程度不相同。

12、在一些实施例中，所述多条预测分支分别输出风险得分，包括：

13、采用任一预测分支对所述个人数据集包括的每个数据进行特征提取，确定所述每个数据的预测标签；

14、基于所述个人数据集包括的多个数据分别的预测标签，确定所述任一预测分支输出的风险得分。

15、第二方面，本申请实施例提供了一种基于不平衡数据集的风险等级识别装置，所述装置包括：

16、获取单元，用于获取目标用户的个人数据集以及风险检测模型；所述风险检测模型是采用多个已知安全等级的用户的个人数据集作为输入，以及采用每个用户的安全等级作为输出进行训练得到的；所述风险检测模型包括多条预测分支和一条动态权重生成分支；在所述风险检测模型的训练过程中，每次迭代是通过模型损失函数同步调整每条预测分支和所述动态权重生成分支的参数；

17、处理单元，用于将目标用户的个人数据集输入到风险检测模型中，基于所述多条预测分支分别输出的风险得分以及所述动态权重生成分支输出的每条预测分支对应的权重，确定所述目标用户的风险等级。

18、在一些实施例中，所述处理单元，具体用于：

19、采用所述每条预测分支对应的权重对所述每条预测分支输出的风险得分进行加权计算，并基于计算结果确定所述模型损失函数的函数值；

20、根据所述函数值调整所述每条预测分支对应的权重，以及调整所述每条预测分支输出的风险得分，并重新计算所述函数值；

21、当所述函数值满足预设条件时，采用所述每条预测分支对应的权重和所述每条预测分支输出的风险得分，确定所述目标用户的风险等级。

22、在一些实施例中，所述处理单元，还用于：

23、对所述个人数据集中包括的数据进行设定程度的数据扰动处理。

24、在一些实施例中，输入到不同预测分支的数据的扰动程度不相同。

25、在一些实施例中，所述处理单元，具体用于：

26、采用任一预测分支对所述个人数据集包括的每个数据进行特征提取，确定所述每个数据的预测标签；

27、基于所述个人数据集包括的多个数据分别的预测标签，确定所述任一预测分支输出的风险得分。

28、第三方面，提供了一种电子设备，所述电子设备包括控制器和存储器。存储器用于存储计算机执行指令，控制器执行存储器中的计算机执行指令以利用控制器中的硬件资源执行第一方面任一种可能实现的方法的操作步骤。

29、第四方面，提供一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面的方法。

30、本申请设置风险检测模型包括多条不同的预测分支以及动态权重生成分支，可以关注不同的数据和特征。相较于传统技术中采用定量的机器学习模型的方案，本申请的方案可以更好地匹配不平衡的数据集，提升模型的泛化能力和识别效果。

本文档来自技高网...

【技术保护点】

1.一种基于不平衡数据集的风险等级识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述多条预测分支分别输出的风险得分以及所述动态权重生成分支输出的每条预测分支对应的权重，确定所述目标用户的风险等级，包括：

3.根据权利要求1或2所述的方法，其特征在于，在将目标用户的个人数据集输入到风险检测模型之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，输入到不同预测分支的数据的扰动程度不相同。

5.根据权利要求1或2所述的方法，其特征在于，所述多条预测分支分别输出风险得分，包括：

6.一种基于不平衡数据集的风险等级识别装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述处理单元，具体用于：

8.根据权利要求6或7所述的装置，其特征在于，所述处理单元，还用于：

9.根据权利要求8所述的装置，其特征在于，输入到不同预测分支的数据的扰动程度不相同。

10.根据权利要求6或7所述的装置，其特征在于，所述处理单元，具体用于：

11.一种电子设备，其特征在于，包括：存储器以及控制器；

12.一种计算机存储介质，存储有计算机可执行指令，其特征在于，所述计算机可执行指令用于执行如权利要求1-5中任一权利要求所述的方法。

...

【技术特征摘要】

1.一种基于不平衡数据集的风险等级识别方法，其特征在于，所述方法包括：

3.根据权利要求1或2所述的方法，其特征在于，在将目标用户的个人数据集输入到风险检测模型之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，输入到不同预测分支的数据的扰动程度不相同。

5.根据权利要求1或2所述的方法，其特征在于，所述多条预测分支分别输出风险得分，包括：

6.一种基于不平衡数...

【专利技术属性】
技术研发人员：苏卓，白燕妮，胡任贤，徐连杰，许辉锋，
申请(专利权)人：天翼安全科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人