【技术实现步骤摘要】
用于预测事件发生概率的方法和装置
本申请实施例涉及计算机
,具体涉及用于预测事件发生概率的方法和装置。
技术介绍
在很多业务场景中,经常需要预测业务中各类事件的发生概率,以便根据预测的发生概率对相关业务进行相应的调整或者操作。例如,在借贷业务平台,预测用户的贷款违约事件发生概率。又例如,在第三方支付业务平台,预测用户的账号被盗事件发生概率。再例如,在保险业务平台,预测用户的保险理赔事件发生概率等等。目前,事件发生概率预测方式主要包括以下两种:其一,业务人员对用户的事件相关信息进行分析,并根据经验预测事件发生概率;其二,将用户的事件相关信息在预设规则库中进行匹配,并根据匹配结果预测事件发生概率。
技术实现思路
本申请实施例提出了用于预测事件发生概率的方法和装置。第一方面,本申请实施例提供了一种用于预测事件发生概率的方法,包括:获取待预测用户的事件相关特征字段集合;对事件相关特征字段集合进行预处理,生成处理事件相关特征字段集合;将处理事件相关特征字段集合输入至预先训练的事件发生概率预测模型,得到待预测用户的事件发生概率,其中,事件发生概率预测模型用于预测用户的事件发 ...
【技术保护点】
1.一种用于预测事件发生概率的方法,包括:获取待预测用户的事件相关特征字段集合;对所述事件相关特征字段集合进行预处理,生成处理事件相关特征字段集合;将所述处理事件相关特征字段集合输入至预先训练的事件发生概率预测模型,得到所述待预测用户的事件发生概率,其中,所述事件发生概率预测模型用于预测用户的事件发生概率。
【技术特征摘要】
1.一种用于预测事件发生概率的方法,包括:获取待预测用户的事件相关特征字段集合;对所述事件相关特征字段集合进行预处理,生成处理事件相关特征字段集合;将所述处理事件相关特征字段集合输入至预先训练的事件发生概率预测模型,得到所述待预测用户的事件发生概率,其中,所述事件发生概率预测模型用于预测用户的事件发生概率。2.根据权利要求1所述的方法,其中,对所述事件相关特征字段集合进行预处理的方式包括以下至少一项:对所述事件相关特征字段集合中的缺失字段进行填充;对所述事件相关特征字段集合中的连续字段进行分段离散化;对所述事件相关特征字段集合中的离散字段进行编码;利用递归特征消除法对所述事件相关特征字段集合进行降维。3.根据权利要求1或2所述的方法,其中,所述事件发生概率预测模型通过如下步骤训练得到:获取训练样本集合,其中,所述训练样本集合中的训练样本包括样本事件相关特征字段集合和样本事件发生标签,所述样本事件发生标签用于标识样本事件的发生情况;利用机器学习方法,基于所述训练样本集合对初始事件发生概率预测模型进行训练,得到所述事件发生概率预测模型。4.根据权利要求3所述的方法,其中,所述训练样本集合通过如下步骤生成:获取参考样本集合,其中,所述参考样本集合中的参考样本包括历史事件相关特征字段集合和历史事件发生标签;对所述参考样本集合中的参考样本中的历史事件相关特征字段集合进行预处理,生成所述训练样本集合。5.根据权利要求4所述的方法,其中,在所述对所述参考样本集合中的参考样本中的历史事件相关特征字段集合进行预处理,生成所述训练样本集合之前,还包括:统计所述参考样本集合中的参考样本的字段缺失比例;将字段缺失比例大于预设比例阈值的参考样本从所述参考样本集合中删除。6.根据权利要求4或5所述的方法,其中,在所述对所述参考样本集合中的参考样本中的历史事件相关特征字段集合进行预处理,生成所述训练样本集合之后,还包括:利用合成少数类过采样技术对所述训练样本集合进行采样,构建新的训练样本,并添加到所述训练样本集合中。7.根据权利要求3所述的方法,其中,所述初始事件发生概率预测模型是梯度提升决策树,包括学习器和残差网络。8.根据权利要求7所述的方法,其中,所述利用机器学习方法,基于所述训练样本集合对初始事件发生概率预测模型进行训练,得到所述事件发生概率预测模型,包括:初始化所述梯度提升决策树中的学习器;执行以下训练步骤:对于所述训练样本集合中的训练样本,将该训练样本中的样本事件相关特征字段集合输入至所述梯度提升决策树,得到该训练样本对应的样本事件发生概率,基于该训练样本中的样本事件发生标签和对应的样本事件发生概率,确定损失函数的损失值是否满足训练目标,若满足训练目标,将所述梯度提升决策树作为所述事件发生概率预测模型。9.根据权利要求8所述的方法,其中,所述利用机器学习方法,基于所述训练样本集合对初始事件发生概率预测模型进行训练,得到所述事件发生概率预测模型,还包括:响应于确定所述损失值不满足训练目标,更新所述梯度提升决策树中的学习器,以及继续执行所述训练步骤。10.一种用于预测事件发生概率的装置,包括:获取单元,被配置成获取待预测用户的事件相关特征字段集合;处理单元,被配置成对所述事件相关特征字段集合进行预处理,生成处理事件相关特征字段集合;预测单元,被配...
【专利技术属性】
技术研发人员:黄耀波,刘明浩,郭江亮,李旭,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。