利用机器学习的选择算子确定、策略组合优化方法及装置制造方法及图纸

技术编号:33503822 阅读:22 留言:0更新日期:2022-05-19 01:13
本说明书实施例提供了一种利用机器学习的选择算子确定、策略组合优化方法及装置。在该方法中,基于选择策略组合时的目标条件和约束条件构建待确定的选择算子,其中包含若干个基算子和对应系数;确定系数的多组第一取值和对应的待选选择算子,针对任意一个待选选择算子,利用多个风险用户样本和该待选选择算子,从策略总集中选择识别效果评分最高的策略组合,并确定策略组合对应的识别结果的目标值;将多组第一取值作为训练样本,将目标值作为标注值训练机器学习模型;确定系数的多组第二取值,将多组第二取值输入训练后的机器学习模型,得到多组预测的目标值;基于已得的目标值中满足预设优选条件的目标值和对应的系数取值,确定选择算子。确定选择算子。确定选择算子。

【技术实现步骤摘要】
利用机器学习的选择算子确定、策略组合优化方法及装置


[0001]本说明书一个或多个实施例涉及数据处理
,尤其涉及一种利用机器学习的选择算子确定、策略组合优化方法及装置。

技术介绍

[0002]随着社会的发展和科技的进步,涌现出越来越多的业务平台,为用户提供各种服务,以满足用户在生活、工作中的各种需求。在业务平台向用户提供服务的过程中,往往会利用预先制定的策略进行与服务相关的决策。例如,信贷平台利用预设策略判别某个用户是否为风险用户,从而决策是否向其提供信用贷款服务。在实际应用中,为了优化决策效果,往往会先建立策略总集,从策略总集中选择最合适的决策组合进行使用。
[0003]因此,希望能有改进的方案,可以提高从策略总集中选择最合适的策略组合时的效果。

技术实现思路

[0004]本说明书一个或多个实施例描述了一种利用机器学习的选择算子确定、策略组合优化方法及装置,以确定更合适的选择算子,进而提高从策略总集中选择最合适的策略组合时的效果。具体的技术方案如下。
[0005]第一方面,实施例提供了一种策略组合中的选择本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种策略组合中的选择算子确定方法,所述选择算子用于在从第一策略总集中选择策略组合时确定策略组合针对多个风险用户样本的识别结果的识别效果评分,所述策略组合用于识别风险用户;所述方法包括:确定选择策略组合时的目标条件和约束条件;所述目标条件包括针对所述识别结果的目标值满足预设优选条件,约束条件包括针对所述识别结果的约束值满足预设限制条件;基于所述目标条件和约束条件构建待确定的选择算子,所述选择算子包含若干个基算子和对应的待确定的系数;确定所述系数的多组第一取值,得到对应的待选选择算子,针对任意一个待选选择算子,利用多个风险用户样本和该待选选择算子,从所述第一策略总集中选择识别效果评分最高的策略组合,并确定所述策略组合对应的识别结果的目标值;将所述多组第一取值作为训练样本,将对应的目标值作为训练样本的标注值,利用所述训练样本和对应的标注值,训练机器学习模型;确定所述系数的多组第二取值,将所述多组第二取值输入训练后的机器学习模型,得到对应的多组预测的目标值;基于已得的目标值中满足所述预设优选条件的目标值和对应的系数取值,确定选择算子。2.根据权利要求1所述的方法,所述基于所述目标条件和约束条件构建待确定的选择算子的步骤,包括:基于所述目标条件中的目标值和所述约束条件中的约束值,构建若干个基算子;基于为每个基算子分配的待确定的系数,对所述若干个基算子进行组合,得到待确定的选择算子。3.根据权利要求1所述的方法,所述利用多个风险用户样本和该待选选择算子,从所述第一策略总集中选择识别效果评分最高的策略组合的步骤,包括:从所述第一策略总集中确定多组策略组合;针对任意一组策略组合,确定该组策略组合针对多个风险用户样本的识别结果,利用该待选选择算子确定所述识别结果的识别效果评分;当得到多组策略组合和对应的识别效果评分时,将最高的识别效果评分对应的策略组合确定为选出的策略组合。4.根据权利要求3所述的方法,所述从所述第一策略总集中确定多组策略组合的步骤,包括:从所述第一策略总集中确定初始的多组策略组合;当从所述初始的多组策略组合中确定选出的策略组合之后,还包括:针对所述第一策略总集中除所述选出的策略组合之外的多个可选策略,将其分别添加至所述选出的策略组合,得到更新后的多组策略组合,返回执行针对任意一组策略组合,确定该组策略组合针对多个风险用户样本的识别结果的步骤。5.根据权利要求1所述的方法,所述利用所述训练样本和对应的标注值,训练机器学习模型的步骤,包括:将所述训练样本输入所述机器学习模型,得到预测的样本目标值;基于所述训练样本对应的标注值与所述样本目标值的差异,确定预测损失;
向减小所述预测损失的方向,更新所述机器学习模型。6.根据权利要求1所述的方法,所述基于已得的目标值中满足所述预设优选条件的目标值和对应的系数取值,确定选择算子的步骤,包括:从已得的目标值中选择满足所述预设优选条件的第一数量个目标值,得到对应的第一数量组取值;基于所述第一数量组取值,确定第一数量个待选选择算子;针对任意一个待选选择算子,利用多个风险用户样本和该待选选择算子,从所述第一策略总集中选择识别效果评分最高的策略组合,并确定所述策略组合对应的识别结果的目标值,作为该待选选择算子对应的目标值;当得到所述第一数量个待选选择算子对应的目标值时,将满足所述预设优选条件的目标值对应的待选选择算子,确定为选择算子。7.根据权利要求1所述的方法,任意一个风险用户样本包括对应用户的用户特征,任意一个策略组合中的策略包括:基于用户特征设定的判别条件,以及满足该判别条件时的风险判别结果。8.根据权利要求1所述的方法,所述目标值包括识别出的风险用户数量,所述预设优选条件包括所述风险用户数量取最大值;所述约束值包括识别出的非风险用户数量,所述预设限制条件包括所述非风险用户数量取最小值。9.根据权利要求1所述的方法,所述目标值包括识别出的风险用户的异常交易金额,所述预设优选条件包括所述异常交易金额取最大值;所述约束值包括识别出的风险用户的正常交易金额,所述预设限制条件包括所述正常交易金额取最小值。10.根据权利要求1所述的方法,所述机器学习模型采用线性回归模型或决策树模型训练。11.一种策略组合的优化方法,用于利用选择算子从第一策略总集中选择策略组合,所述选择算子用于确定策略组合针对多个风险用户样本的识别结果的识别效果评分,所述策略组合用于识别风险用户,所述方法包括:确定选择策略组合时的目标条件和约束条件;所述目标条件包括针对所述识别结果的目标值满足预设优选条件,约束条件包括针对所述识别结果的约束值满足预设限制条件;基于所述目标条件和约束条件构建待确定的选择算子,所述选择算子包含若干个基算子和对应的待确定的系数;确定所述系数的多组第一取值,得到对应的待选选择算子,针对任意一个待选选择算子,利用多个风险用户样本和该待选选择算子,从所述第一策略总集中选择识别效果评分最高的策略组合,并确定所述策略组合对应的识别结果的目标值;将所述多组第一取值作为训练样本,将对应的目标值作为训练样本的标注值,利用所述训练样本和对应的标注值,训练机器学习模型;确定所述系数的多组第二取值,将所述多组第二取值输入训练后的机器学习模型,得到对应的多组预测的目标值;基于已得的目标值中满足所述预设优选条件的目标值和对应的系数取值,确定选择算子;利用确定的选择算子,从所述第一策略总集中选择识别效果评分最高的策略组合,作
为优化的策略组合。12.一种策略组合的优化方法,包括:获取待优化的第二策略总集;获取权利要求1中确定的选择算子;利用多个风险用户样本和所述确定的选择算子,从所述第二策略总集中选择识别效果评分最高的策略组合,作为优化的策略组合。13.一种策略组合中的选择算子确定方法,所述选择算子用于在从第一策略总集中选择策略组合时确定策略组合...

【专利技术属性】
技术研发人员:顾咏丰丁皓吴华
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1