一种基于代价敏感损失函数的指定客群类型区分方法及装置制造方法及图纸

技术编号：41203300 阅读：3 留言：0更新日期：2024-05-07 22:29

本发明专利技术公开了一种基于代价敏感损失函数的指定客群类型区分方法及装置，所述方法包括：构建待优化模型的代价敏感损失函数、评价函数以及搜索参数；基于训练集和验证集在搜索范围内，采用指定搜索方式和所述搜索参数执行参数搜索并基于代价敏感损失函数迭代训练所述待优化模型，得到搜索目标对应的优化搜索参数以及所述优化搜索参数对应的优化模型；采用所述优化模型对属于指定客群的客户进行类型区分，确定所述客户所属类型。本发明专利技术能够满足对指定客群的客户进行类型区别，确定好坏客户的应用场景的安全需求，保障系统安全。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机处理，具体而言，涉及一种基于代价敏感损失函数的指定客群类型区分方法、装置、电子设备及计算机可读介质。

技术介绍

1、现有技术中可以通过机器学习模型来确定用户的安全性，这种方式所采用的机器学习模型需要通过多次迭代训练来更新参数得到。而实际中，不同的应用场景对用户安全性识别要求不尽相同，差异化地运用不同的训练优化手段，能够得到更加契合实际应用场景需要的数据识别效果。比如：常规的用户安全性识别场景中，用交叉熵损失和区分度ks作为评价函数进行超参搜索，可较好的识别数据安全性。在识别欺诈客户的应用场景中，需要用焦点(focal)损失函数和提升度(lift)评价函数的组合进行多次迭代，从而提升识别欺诈客户的准确性。

2、而随着服务的客户不断增多，对于不同类型的客户进行分类的难度也越来越大，比如，欺诈客户会对自身的情况进行包装以规避系统的识别；普通客户群体则容易出现数据缺失导致无法准确识别，因此，亟需要一种适用于指定客群类型区分方法，以适应对客户进行区分的新需求。

技术实现思路

1、有鉴于此，本专利技术主要目的在于提出一种基于代价敏感损失函数的指定客群类型区分方法、装置、电子设备及计算机可读介质，以期至少部分地解决上述技术问题中的至少之一。

2、为了解决上述技术问题，本专利技术第一方面提出一种基于代价敏感损失函数的指定客群类型区分方法，所述方法包括：

3、构建待优化模型的代价敏感损失函数、评价函数以及搜索参数；所述代价敏感损失函数包含对模型

4、根据所述评价函数配置不同搜索方式对应的搜索目标；

5、基于训练集和验证集在搜索范围内，采用指定搜索方式和所述搜索参数执行参数搜索并基于代价敏感损失函数迭代训练所述待优化模型，得到搜索目标对应的优化搜索参数以及所述优化搜索参数对应的优化模型；

6、采用所述优化模型对属于指定客群的客户进行类型区分，确定所述客户所属类型。

7、根据本专利技术一种优选实施方式，所述代价敏感损失函数由第一函数和第二函数组成，所述第一函数包含对模型输出不同类型样本的惩罚程度，用于确定指定类型样本的损失；所述第二函数用于确定剩余样本的损失；所述指定类型样本数量及剩余样本数量根据指定类型样本占比确定。

8、根据本专利技术一种优选实施方式，所述基于训练集和验证集在搜索范围内，采用指定搜索方式和所述搜索参数执行参数搜索并基于代价敏感损失函数迭代训练所述待优化模型，得到搜索目标对应的优化搜索参数以及所述优化搜索参数对应的优化模型包括：

9、接收训练集和验证集、搜索范围以及指定搜索方式；

10、基于训练集和验证集执行当前轮参数搜索：在当前搜索参数组合下，基于训练集迭代训练所述待优化模型，使代价敏感损失函数最小，并基于验证集得到评价函数的输出结果；

11、在搜索范围内，采用指定搜索方式更新搜索参数组合，执行下一轮参数搜索；

12、当满足搜索条件后，结束搜索，输出搜索目标对应的优化搜索参数以及所述优化搜索参数对应的优化模型。

13、根据本专利技术一种优选实施方式，所述根据所述评价函数配置不同搜索方式对应的搜索目标包括：

14、搜索方式为贝叶斯搜索时，根据评价函数确定更新搜索参数组合的搜索路径和搜索结果，将评价函数输出的最优搜索结果作为搜索目标；

15、搜索方式为网格搜索和随机搜索时，在每轮参数搜索结束后保存评价函数的输出结果作为搜索结果，将最优搜索结果作为搜索目标。

16、根据本专利技术一种优选实施方式，所述搜索参数包括：指定类型样本占比，不同类型样本惩罚程度，以及模型迭代次数。

17、为解决上述技术问题，本专利技术第二方面提供一种基于代价敏感损失函数的指定客群类型区分装置，所述装置包括：

18、构建模块，用于构建待优化模型的代价敏感损失函数、评价函数以及搜索参数；所述代价敏感损失函数包含对模型输出不同类型样本的惩罚程度；所述评价函数反映模型在指定客群中对指定类型样本的区分度；

19、配置模块，用于根据所述评价函数配置不同搜索方式对应的搜索目标；

20、搜索模块，用于基于训练集和验证集在搜索范围内，采用指定搜索方式和所述搜索参数执行参数搜索并基于代价敏感损失函数迭代训练所述待优化模型，得到搜索目标对应的优化搜索参数以及所述优化搜索参数对应的优化模型；

21、挖掘模块，用于采用所述优化模型对属于指定客群的客户进行类型区分，确定所述客户所属类型。

22、根据本专利技术一种优选实施方式，所述代价敏感损失函数由第一函数和第二函数组成，所述第一函数包含对模型输出不同类型样本的惩罚程度，用于确定指定类型样本的损失；所述第二函数用于确定剩余样本的损失；所述指定类型样本数量及剩余样本数量根据指定类型样本占比确定。

23、根据本专利技术一种优选实施方式，所述搜索模块包括：

24、接收模块，用于接收训练集和验证集、搜索范围以及指定搜索方式；

25、执行模块，用于基于训练集和验证集执行当前轮参数搜索：在当前搜索参数组合下，基于训练集迭代训练所述待优化模型，使代价敏感损失函数最小，并基于验证集得到评价函数的输出结果；在搜索范围内，采用指定搜索方式更新搜索参数组合，执行下一轮参数搜索；

26、输出模块，用于当满足搜索条件后，结束搜索，输出搜索目标对应的优化搜索参数以及所述优化搜索参数对应的优化模型。

27、根据本专利技术一种优选实施方式，所述配置模块用于：

28、搜索方式为贝叶斯搜索时，根据评价函数确定更新搜索参数组合的搜索路径和搜索结果，将评价函数输出的最优搜索结果作为搜索目标；

29、搜索方式为网格搜索和随机搜索时，在每轮参数搜索结束后保存评价函数的输出结果作为搜索结果，将最优搜索结果作为搜索目标。

30、根据本专利技术一种优选实施方式，所述搜索参数包括：指定类型样本占比，不同类型样本惩罚程度，以及模型迭代次数。

31、为解决上述技术问题，本专利技术第三方面提供一种电子设备，包括：

32、处理器；以及

33、存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器执行上述任一项所述的方法。

34、为解决上述技术问题，本专利技术第四方面提供一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，当所述一个或多个程序被处理器执行时，实现上述方法。

35、本专利技术基于基于代价敏感损失函数的指定客群类型区分的应用场景，构建待优化模型的代价敏感损失函数、评价函数以及搜索参数；根据所述评价函数配置不同搜索方式对应的搜索目标；基于训练集和验证集在搜索范围内，采用指定搜索方式和所述搜索参数执行参数搜索并基于代价敏感损失函数迭代训练所述待优化模型，得到搜索目标对应的优化搜索参本文档来自技高网...

【技术保护点】

1.一种基于代价敏感损失函数的指定客群类型区分方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述代价敏感损失函数由第一函数和第二函数组成，所述第一函数包含对模型输出不同类型样本的惩罚程度，用于确定指定类型样本的损失；所述第二函数用于确定剩余样本的损失；所述指定类型样本数量及剩余样本数量根据指定类型样本占比确定。

3.根据权利要求2所述的方法，其特征在于，所述基于训练集和验证集在搜索范围内，采用指定搜索方式和所述搜索参数执行参数搜索并基于代价敏感损失函数迭代训练所述待优化模型，得到搜索目标对应的优化搜索参数以及所述优化搜索参数对应的优化模型包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述评价函数配置不同搜索方式对应的搜索目标包括：

5.根据权利要求2所述的方法，其特征在于，所述搜索参数包括：指定类型样本占比，不同类型样本惩罚程度，以及模型迭代次数。

6.一种基于代价敏感损失函数的指定客群类型区分装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于

8.根据权利要求7所述的装置，其特征在于，所述搜索模块包括：

9.根据权利要求8所述的装置，其特征在于，所述配置模块用于：

10.根据权利要求7所述的装置，其特征在于，所述搜索参数包括：指定类型样本占比，不同类型样本惩罚程度，以及模型迭代次数。

11.一种电子设备，包括：

12.一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，当所述一个或多个程序被处理器执行时，实现权利要求1至5中任一项所述的方法。

...

【技术特征摘要】

1.一种基于代价敏感损失函数的指定客群类型区分方法，其特征在于，所述方法包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述评价函数配置不同搜索方式对应的搜索目标包括：

5.根据权利要求2所述的方法，其特征在于，所述搜索参数包括：指定类型样本占比，不同类型样本惩罚程度，以及模型迭代次数。

【专利技术属性】
技术研发人员：李心宇，聂婷婷，
申请(专利权)人：上海淇毓信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人