策略组合的优化方法及装置制造方法及图纸

技术编号:33276223 阅读:21 留言:0更新日期:2022-04-30 23:35
本说明书实施例提供一种策略组合的优化方法,包括:获取用于识别风险用户的w个当前策略组合,其中各个当前策略组合包括n个已选策略;w为大于1的整数,n为正整数;通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,其中各个第一策略组合包括n+1个已选策略;确定所述各个第一策略组合针对多个风险用户样本的识别效果评分;根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合。个当前策略组合。个当前策略组合。

【技术实现步骤摘要】
策略组合的优化方法及装置


[0001]本说明书一个或多个实施例涉及计算机
,尤其涉及一种策略组合的优化方法及装置。

技术介绍

[0002]随着社会的发展和科技的进步,涌现出越来越多的业务平台,为用户提供各种服务,以满足用户在生活、工作中的各种需求。在业务平台向用户提供服务的过程中,往往涉及利用预先制定的策略进行与服务相关的决策,例如,信贷平台利用预设策略判别某个用户是否为风险用户,从而决策是否向其提供信用贷款服务。
[0003]实际,为优化决策效果,会对多个策略进行组合使用,因此,需要一种方案,能够从策略池中挑选出足够优良的策略子集,以有效提高业务决策效果。

技术实现思路

[0004]本说明书一个或多个实施例描述策略组合的优化方法及装置,在策略组合的迭代过程中增加搜索宽度,在每次迭代中保留多个较好的策略,使下次迭代在这些策略基础上作搜索,从而增大找到最优策略组合的概率。
[0005]根据第一方面,提供一种策略组合的优化方法。该方法包括:获取用于识别风险用户的w个当前策略组合,其中各个当前策略组合包括n个已选策略;w为大于1的整数,n为正整数;通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,其中各个第一策略组合包括n+1个已选策略;确定所述各个第一策略组合针对多个风险用户样本的识别效果评分;根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合。
[0006]在一个实施例中,通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,包括:对于各个当前策略组合,将所述策略总集中除该当前策略组合中的n个已选策略以外的策略作为可选策略,分别将各个可选策略添加到该当前策略组合,得到对应的多个第二策略组合;通过对所述w个当前策略组合对应的所有第二策略组合进行去重处理,得到所述多个第一策略组合。
[0007]在一个实施例中,各个风险用户样本中包括对应用户的用户特征,各个已选策略包括基于用户特征设定的判别条件以及满足该判别条件时的风险判别结果。
[0008]在一个实施例中,各个风险用户样本中包括对应用户的用户特征和异常交易金额;其中,确定所述各个第一策略组合针对多个风险用户样本的识别效果评分,包括:针对所述各个第一策略组合,利用其基于所述用户特征进行风险用户识别,并根据识别出的风险用户所对应异常交易金额的和值,确定该第一策略组合的识别效果评分。
[0009]在一个实施例中,根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,包括:从所述多个第一策略组合中选出识别效果评分排在前w位的w个第一策略组合。
[0010]在一个实施例中,在根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合之后,所述方法还包括:判断本轮迭代更新前后的w个当前策略组合的识别效果评分均值之间的差值是否小于预设阈值;在判断出小于的情况下,将本轮迭代更新后的w个当前策略组合中识别效果评分最高的当前策略组合确定为待使用的策略组合。
[0011]根据第二方面,提供一种策略组合的优化方法。该方法包括:获取用于执行目标判别任务的w个当前策略组合,其中各个当前策略组合包括n个已选策略;w为大于1的整数,n为正整数;通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,其中各个第一策略组合包括n+1个已选策略;确定所述各个第一策略组合针对多个任务标注样本的识别效果评分;根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合。
[0012]根据第三方面,提供一种策略组合的优化装置,包括:组合获取单元,配置为获取用于识别风险用户的w个当前策略组合,其中各个当前策略组合包括n个已选策略;w为大于1的整数,n为正整数;策略添加单元,配置为通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,其中各个第一策略组合包括n+1个已选策略;评分确定单元,配置为确定所述各个第一策略组合针对多个风险用户样本的识别效果评分;组合更新单元,配置为根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合。
[0013]根据第四方面,提供一种策略组合的优化装置,包括:组合获取单元,配置为获取用于执行目标判别任务的w个当前策略组合,其中各个当前策略组合包括n个已选策略;w为大于1的整数,n为正整数;策略添加单元,配置为通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,其中各个第一策略组合包括n+1个已选策略;评分确定单元,配置为确定所述各个第一策略组合针对多个任务标注样本的识别效果评分;组合更新单元,配置为根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合。
[0014]根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面的方法。
[0015]根据第六方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,该处理器执行所述可执行代码时,实现第一方面或第二方面的方法。
[0016]采用本说明书实施例提供的方法和装置,在策略组合的迭代过程中增加搜索宽度,在每次迭代中保留多个较好的策略,使下次迭代在这些策略基础上作搜索,从而增大找到最优策略组合的概率。
附图说明
[0017]为了更清楚地说明本专利技术实施例的技术方案,下面对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0018]图1示出根据一个实施例的策略组合优化的实施过程示意图;
图2示出根据一个实施例的策略组合的优化方法流程示意图;图3示出根据另一个实施例的策略组合的优化方法流程示意图;图4示出根据一个实施例的策略组合的优化装置结构示意图;图5示出根据另一个实施例的策略组合的优化装置结构示意图。
具体实施方式
[0019]下面结合附图,对本说明书提供的方案进行描述。
[0020]承前所述,在许多业务场景中,策略池(或称策略总集)中存在数以千计的大量备选策略(或称规则),需要从中挑选出最优策略子集,用于执行对应场景下的业务决策。在一种实施方式中,在对策略组合进行初始化后,利用贪心算法向其中逐个增加策略,直到满足停止准则,将此时输出的策略组合作为最终使用的策略组合。然而,在此种实施方式中,每一步只关注最优规则,这可能会缩小搜索范围,最终使策略组合陷入局部最优。
[0021]基于以上观察和分析,专利技术人提出另一种实施方式,为扩大搜索宽度并跳出局部最优,考虑在每次迭代中保留最优、次优策略,并在下一次迭本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种策略组合的优化方法,包括:获取用于识别风险用户的w个当前策略组合,其中各个当前策略组合包括n个已选策略;w为大于1的整数,n为正整数;通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,其中各个第一策略组合包括n+1个已选策略;确定所述各个第一策略组合针对多个风险用户样本的识别效果评分;根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合。2.根据权利要求1所述的方法,其中,通过向所述各个当前策略组合中添加策略总集中的可选策略,得到多个第一策略组合,包括:对于各个当前策略组合,将所述策略总集中除该当前策略组合中的n个已选策略以外的策略作为可选策略,分别将各个可选策略添加到该当前策略组合,得到对应的多个第二策略组合;通过对所述w个当前策略组合对应的所有第二策略组合进行去重处理,得到所述多个第一策略组合。3.根据权利要求1所述的方法,其中,各个风险用户样本中包括对应用户的用户特征,各个已选策略包括基于用户特征设定的判别条件以及满足该判别条件时的风险判别结果。4.根据权利要求1所述的方法,其中,各个风险用户样本中包括对应用户的用户特征和异常交易金额;其中,确定所述各个第一策略组合针对多个风险用户样本的识别效果评分,包括:针对所述各个第一策略组合,利用其基于所述用户特征进行风险用户识别,并根据识别出的风险用户所对应异常交易金额的和值,确定该第一策略组合的识别效果评分。5.根据权利要求1所述的方法,其中,根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,包括:从所述多个第一策略组合中选出识别效果评分排在前w位的w个第一策略组合。6.根据权利要求1所述的方法,其中,在根据所述识别效果评分,从所述多个第一策略组合中选取w个第一策略组合,作为本轮迭代更新后的w个当前策略组合之后,所述方法还包括:判断本轮迭代更新前后的w个当前策略组合的识别效果评分均值之间的差值是否小于预设阈值;在判断出小于的情况下,将本轮迭代更新后的w个当前策略组合中识别效果评分最高的当前策略组合确定为待使用的策略组合。7.一...

【专利技术属性】
技术研发人员:顾咏丰丁皓吴华
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1