【技术实现步骤摘要】
一种基于决策树模型的数据处理方法及相关设备
[0001]本专利技术涉及人工智能
,尤其涉及一种基于决策树模型的数据处理方法及相关设备。
技术介绍
[0002]随着互联网技术的飞速发展,出现了一种任务平台,所谓任务平台即时指可以发布产品提供方提供有偿任务的平台,有偿任务可以是给特定产品推广、销售某一种商品等等,用户可以在任务平台上接受任务后完成任务,进而得到任务平台转入的资源数据。
[0003]目前,任务平台为了吸引更多的用户,通常会提高资源数据核算和转移的速度,例如,任务平台可以在用户接受并完成任务后向该用户转移该任务对应的资源数据。但是在某些场景中,例如购物场景下,该任务为销售某一特定的商品,用户销售了商品,获得了任务平台转入的资源数据,但是后续商品出现了退款的情况。因此,产品提供方视该任务为失败,则不会将该任务对应的资源数据转入至该任务平台,但是该任务平台已向用户转移了该任务的资源数据,从而任务平台需要向该用户追还该任务的资源数据,导致了平台资源数据的损失,对于任务平台在说,资源数据的转移风险较大,安全性低 ...
【技术保护点】
【技术特征摘要】
1.一种基于决策树模型的数据处理方法,其特征在于,包括:接收目标账户发送的资源数据转移请求,所述资源数据转移请求携带所述目标账户的任务标识,所述任务标识用于指示第一任务;获取所述目标账户的第一账户信息和第一历史任务信息,将所述第一账户信息和所述第一历史任务信息输入至预训练的目标决策树模型中,得到所述目标账户的风险评估分数;在所述风险评估分数小于风险评估阈值的情况下,确定所述目标账户的风险评估结果通过,并确定所述第一任务对应的第一数据量;对所述目标账户进行身份验证,在所述目标账户的身份验证结果为通过的情况下,向所述目标账户转入所述第一数据量的资源数据;在确定所述第一任务未达到任务完成节点的情况下,确定所述第一任务对应的第一节点和任务异常信息,根据所述任务异常信息确定第二数据量,并向所述目标账户转入所述第二数据量的资源数据,所述第二数据量为小于零的数据量。2.根据权利要求1所述的方法,其特征在于,所述将所述第一账户信息和所述第一历史任务信息输入至预训练的目标决策树模型中,得到所述目标账户的风险评估分数之前,还包括:构建训练样本集,所述训练样本集包括正样本和负样本,所述正样本和所述负样本是根据多个账户中参考账户的第二账户信息的风险特征和第二历史任务信息的风险特征确定的;确定所述第二账户信息的风险特征对应的参考账户个数占总账户个数的第一比例数据,确定所述第二历史任务信息的风险特征对应的参考账户个数占总账户个数的第二比例数据;根据所述第一比例数据确定所述第二账户信息的风险特征的信息增益,并根据所述第二比例数据确定所述第二历史任务信息的风险特征的信息增益;将所述第二账户信息的风险特征的信息增益和所述第二历史任务信息的风险特征的信息增益输入预设的决策树模型进行训练,得到初始决策树模型。3.根据权利要求2所述的方法,其特征在于,所述构建训练样本集,包括:获取所述多个账户中参考账户的第二账户信息和第二历史任务信息,根据预设的风险评估项确定所述第二账户信息中的风险特征和所述第二历史任务信息中的风险特征,所述参考账户为所述多个账户中的任一账户;确定所述参考账户在预设时长内执行的第二任务达到任务完成节点的数量占总执行的任务数量的比例;若所述比例大于预设比例阈值,则将所述第二账户信息中的风险特征和所述第二历史任务信息中的风险特征作为正样本,若所述比例小于所述预设比例阈值,则将所述第二账户信息中的风险特征和所述第二历史任务信息中的风险特征作为负样本,确定所述正样本和所述负样本为所述训练样本集。4.根据权利要求2所述的方法,其特征在于,所述将所述第二账户信息的风险特征的信息增益和所述第二历史任务信息的风险特征的信息增益输入预设的决策树模型进行训练,得到初始决策树模型之后,还包括:
根据所述初始决策树模型中从根节点至各个叶子节点的路径,得到多个路径;获取所述多个路径中目标路径对应的负样本个数和总样本个数,所述目标路径为所述多个路径中任一路径;将所述目标路径对应的负样本个数占总样本个数的比例确定所述目标路径对应的风险评估分数;将所述目标路径对应的风险评估分数标注在所述目标路径的叶子节点处,得到所述...
【专利技术属性】
技术研发人员:李佳颖,汪凌峰,
申请(专利权)人:未鲲上海科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。