数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:31310177 阅读:44 留言:0更新日期:2021-12-12 21:39
本申请涉及一种数据处理方法、装置、计算机设备和存储介质。所述方法包括:获取目标用户群对应的目标用户群画像,获取已训练好的目标用户资源共享意愿模型,将目标用户群画像输入至目标用户资源共享意愿模型中,通过目标用户资源共享意愿模型对目标用户群画像进行目标用户群特征变量提取,根据提取后的目标用户群特征变量进行推断,输出目标用户群中各个目标用户对应的目标用户资源共享意愿分数,根据目标用户资源共享意愿分数确定对应的目标用户资源共享方式,向目标用户执行对应的目标用户资源共享方式。采用本方法能够用户资源共享的合理性和准确性。的合理性和准确性。的合理性和准确性。

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种数据处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]在互联网金融领域,如果想要对目标客户群进行促借款的营销,传统的技术方案有如下两种:一是圈选出需要经营的目标客户群,由于不确定哪些用户会来借款,针对这部分客户群全量发放优惠券,以希望用户来平台完成借款,达到营销目的。二是通过随机分流(A/B test),比如10%的用户发10元优惠券,然后通过智能语音通知用户;10%的用户发10元优惠券,然后发送短信通知用户;另外80%的用户发送10元优惠券,采用发送短信通知用户,形成对比组,最后看哪种营销方式下用户的借款率高,然后调整对应的百分比。然而,传统的技术方案无法在目标客户群中精准的识别出有借款意愿的人群,导致促借款的营销效果不佳。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种数据处理方法、装置、计算机设备和存储介质,通过目标用户资源共享意愿模型能够精准识别出目标用户群中各目标用户对应的用户资源共享意愿分,根本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,所述方法包括:获取目标用户群对应的目标用户群画像;获取已训练好的目标用户资源共享意愿模型,其中,所述目标用户资源共享意愿模型是基于训练特征以及训练数据,通过基尼系数的计算进行特征的选取,根据选取后的特征变量构建原始用户资源共享意愿模型,通过对所述原始用户资源共享意愿模型进行训练得到的;将所述目标用户群画像输入至所述目标用户资源共享意愿模型中,通过所述目标用户资源共享意愿模型对所述目标用户群画像进行目标用户群特征变量提取,根据提取后的所述目标用户群特征变量进行推断,输出所述目标用户群中各个目标用户对应的目标用户资源共享意愿分数;根据所述目标用户资源共享意愿分数确定对应的目标用户资源共享方式;向所述目标用户执行对应的目标用户资源共享方式。2.根据权利要求1所述的方法,其特征在于,所述目标用户资源共享意愿模型的训练步骤包括:获取大量训练样本数据,所述训练样本数据包括多个训练特征变量;计算得到各所述训练特征变量对应的基尼系数;根据各所述基尼系数确定各所述训练特征变量之间的连接关系,得到当前用户资源共享意愿模型;从所述当前用户资源共享意愿模型中确定当前特征变量分割点,根据所述当前模型结构计算得到所述当前用户资源共享意愿模型的当前信息增益;在所述当前信息增益满足预期信息增益值时,确定所述当前用户资源共享意愿模型为原始用户资源共享意愿模型;通过开发样本数据和实验样本数据对所述原始用户资源共享意愿模型进行交叉验证,得到目标用户资源共享意愿模型;优选地,通过开发样本数据和实验样本数据对所述原始用户资源共享意愿模型进行交叉验证,得到目标用户资源共享意愿模型,包括:获取所述开发样本数据中具有借款意愿的样本量,获取具有借款意愿的样本中真正借款的第一人数;获取所述开发样本数据中真正借款的第二人数,获取所述实验样本数据中真正借款的第三人数;根据所述第二人数和所述开发样本数据的总数目计算得到所述开发样本数据对应的第一借款率,根据第一人数和第二人数计算得到借款意愿识别占比;根据所述第三人数和所述实验样本数据的总数目计算得到所述实验样本数据对应的第二借款率,根据所述第一人数和所述具有借款意愿的样本量计算得到借款意愿识别率;在所述第一借款率与所述第二借款率的差值达到预设差值时,且所述借款意愿识别占比和所述借款意愿识别率分别达到相应的预期目标时,确定所述原始用户资源共享意愿模型的训练结束,得到目标用户资源共享意愿模型。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述当前信息增益不满足预期信息增益值时,更改各所述训练特征变量之间的连接
关系,得到中间用户资源共享意愿模型;将所述中间用户资源共享意愿模型确定为当前用户资源共享意愿模型,返回执行步骤从所述当前用户资源共享意愿模型中确定当前特征变量分割点,直至所述当前信息增益满足预期信息增益值。4.根据权利要求2所述的方法,其特征在于,所述计算得到各所述训练特征变量对应的基尼系数,包括:从各所述训练特征变量中确定当前特征变量,获取所述训练样本数据中所述当前特征变量的当前特征变量集,以及所述训练样本数据中非当前特征变量的非当前特征变量集;计算所述当前特征变量集中类别为目标类...

【专利技术属性】
技术研发人员:刘健石松坡
申请(专利权)人:上海数禾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1