【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及计算机可读介质
[0001]本申请涉及人工智能、大数据领域,具体涉及机器学习、数据预处理领域,尤其涉及一种数据处理方法、装置、电子设备及计算机可读介质。
技术介绍
[0002]目前市场上对公积金数据的应用仍大多专注于利用公积金贷款数据分析客户的风险等级方面,在一些客户画像中亦是常以易获得的基础性指标为主要呈现。整体来看,市场上对于公积金价值字段的数据挖掘工作目前仍存在较大的进步空间。
[0003]在实现本申请过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]对公积金价值字段的利用不充分,市场上对于公积金价值字段的数据挖掘工作目前仍存在较大的进步空间。
技术实现思路
[0005]有鉴于此,本申请实施例提供一种数据处理方法、装置、电子设备及计算机可读介质,能够解决现有的对公积金价值字段的利用不充分,市场上对于公积金价值字段的数据挖掘工作目前仍存在较大的进步空间的问题。
[0006]为实现上述目的,根据本申请实施例的一个方面,提供了一种数据处理
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:接收业务申请请求,确定对应的业务标识,提取所述业务申请请求对应的公积金数据的数据特征,进而从所述数据特征中确定各所述业务标识对应的数据特征;调用预测模型,确定所述预测模型中与各所述业务标识对应的分类器;将所述各所述业务标识对应的数据特征输入对应的分类器,以得到对应的模型预测概率;根据各所述模型预测概率,确定对应的工作稳定等级,以基于所述工作稳定等级,调用对应的策略,以对所述业务申请请求进行处理。2.根据权利要求1所述的方法,其特征在于,在所述调用预测模型之前,所述方法还包括:获取初始梯度提升模型;获取训练样本数据,所述训练样本数据包括携带有用户标识和观察时点的公积金数据以及标注的模型预测概率;将所述携带有用户标识和观察时间的公积金数据作为所述初始梯度提升模型的输入,将所述标注的对应的模型预测概率作为所述初始梯度提升模型的期望输出,调用梯度提升树算法,对所述初始梯度提升模型进行迭代训练,以得到所述预测模型。3.根据权利要求2所述的方法,其特征在于,所述获取训练样本数据,包括:获取企业各员工的公积金数据,对所述企业各员工的初始公积金数据进行格式化和数值字段单位的统一化,生成预处理公积金数据;确定所述预处理公积金数据的业务标识,基于所述预处理公积金的业务标识对所述预处理公积金数据进行拆解;对拆解后的预处理公积金数据进行交叉结合,对交叉结合的预处理公积金数据进行特征提取,对提取的特征进行特征衍生和特征清洗,以得到携带有用户标识和观察时点以及标注有对应的模型预测概率的公积金数据,进而确定为训练样本数据。4.根据权利要求2所述的方法,其特征在于,所述对所述初始梯度提升模型进行迭代训练,包括:响应于所述期望输出与所述输入对应的标注的模型预测概率不匹配,确定当前输入初始梯度提升模型的训练样本数据的训练权重;基于预设的训练权重等级,确定高于所述训练权重的目标训练权重,将所述训练权重更新为所述目标训练权重。5.根据权利要求3所述的方法,其特征在于,所述得到所述预测模型,包括:调用各所述预处理公积金数据的业务标识对应的训练样本数据分别对所述初始梯度提升模型的各决策树进行训练,进而得到训练完成的分类器;组合各所述分类器,以得到所述预测模型。6.根据权利要求1所述的方法,其特征在于,所述确定对应的工作稳定等级,包括:获取所述公积金数据对应的公积金断缴数据;基于所述公积金断缴数据确定异常用户概率,进而基于所述异常用户概率确定正常用户概率;基于所述异常用户概率、所述正常用户概率和预设系数,确定评分分值;
基于预设的评分分值和工作稳定等级的对应关系和所述评分分值,确定对应的工作稳定等级。7.根据权利要求2所述的方法,其特征在于,在所述得到所述预测模型之前,所述方法还包括:获取测试样本数据和验证样本数据,根据所述测试样本数据和验证样本数据对所述预测模型的模型参数进行更新。8.一种数据处理装置,其特征在于,包括:接收单元,被配置成接收业务申请请求,确定对应的业务标识,提取所述业务申请请求对应的公积金数据的数据特征,进而从所述数据特征中确定各所述业务标识对应的数据特征;分类器确定单元,被配置成...
【专利技术属性】
技术研发人员:曾桂平,杨旸,陈芷君,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。