数据处理方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号:26173772 阅读:27 留言:0更新日期:2020-10-31 13:58
本申请的实施例提供了一种数据处理方法、装置、计算机可读介质及电子设备。该数据处理方法包括:获取目标区域内针对指定业务的用户样本数据;基于所述用户样本数据确定与所述目标区域相关联的模型变量;根据所述用户样本数据和与所述目标区域相关联的模型变量,构建与所述目标区域相对应的针对所述指定业务的预测模型;通过所述预测模型从所述目标区域内的用户中识别出所述指定业务的潜在用户。本申请实施例的技术方案能够针对不同的区域和业务来识别潜在用户,实现了精细化的识别过程,进而可以得到更准确、更科学及更合理的识别结果。

【技术实现步骤摘要】
数据处理方法、装置、计算机可读介质及电子设备
本申请涉及计算机及通信
,具体而言,涉及一种数据处理方法、装置、计算机可读介质及电子设备。
技术介绍
在业务推广过程中,比较常用的一种方式是粗狂式投放推送,即没有区分性和针对性地向广大用户进行投放,这种方式不仅成本较高,而且用户转化率较低。
技术实现思路
本申请的实施例提供了一种数据处理方法、装置、计算机可读介质及电子设备,进而至少在一定程度上可以针对不同的区域和业务来识别潜在用户,实现了精细化的识别过程,进而可以得到更准确、更科学及更合理的识别结果,以便于采取针对性的投放推送,有利于提高业务推广的转化效果,并且可以降低推广成本。本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。根据本申请实施例的一个方面,提供了一种数据处理方法,包括:获取目标区域内针对指定业务的用户样本数据;基于所述用户样本数据确定与所述目标区域相关联的模型变量;根据所述用户样本数据和与所述目标区域相关联的模型变量,构建与所述目标区域相对应的针对所述指定业本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取目标区域内针对指定业务的用户样本数据;/n基于所述用户样本数据确定与所述目标区域相关联的模型变量;/n根据所述用户样本数据和与所述目标区域相关联的模型变量,构建与所述目标区域相对应的针对所述指定业务的预测模型;/n通过所述预测模型从所述目标区域内的用户中识别出所述指定业务的潜在用户。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取目标区域内针对指定业务的用户样本数据;
基于所述用户样本数据确定与所述目标区域相关联的模型变量;
根据所述用户样本数据和与所述目标区域相关联的模型变量,构建与所述目标区域相对应的针对所述指定业务的预测模型;
通过所述预测模型从所述目标区域内的用户中识别出所述指定业务的潜在用户。


2.根据权利要求1所述的数据处理方法,其特征在于,获取目标区域内针对指定业务的用户样本数据,包括:
从所述目标区域内的用户样本数据中选取在第一时间段内未开通所述指定业务,但在所述第一时间段之后的第二时间段内开通了所述指定业务的用户样本数据作为所述目标区域内针对所述指定业务的正样本数据;
从所述目标区域内的用户样本数据中选取在所述第一时间段和所述第二时间段内均未开通所述指定业务的用户样本数据作为所述目标区域内针对所述指定业务的负样本数据。


3.根据权利要求1所述的数据处理方法,其特征在于,还包括:
获取用户的交易数据;
若根据所述交易数据确定所述用户在最近预定时长内交易次数最多的区域是所述目标区域,且最近预定时长内在所述目标区域内的交易次数达到设定次数,则将所述用户的关联数据作为所述目标区域内的用户样本数据。


4.根据权利要求1所述的数据处理方法,其特征在于,基于所述用户样本数据确定与所述目标区域相关联的模型变量,包括:
获取与所述用户样本数据相关联的变量;
基于与所述用户样本数据相关联的各个变量的值,确定所述各个变量对所述用户样本数据中的正样本数据和负样本数据的区分能力;
根据所述各个变量对所述正样本数据和所述负样本数据的区分能力,选择预定数量个变量作为与所述目标区域相关联的模型变量。


5.根据权利要求4所述的数据处理方法,其特征在于,获取与所述用户样本数据相关联的变量,包括:
获取所述用户样本数据中所包含的基础变量;
根据所述用户样本数据中所包含的指定类型的基础变量,生成所述指定类型的基础变量对应的衍生变量;
将所述衍生变量和所述用户样本数据中所包含的基础变量作为与所述用户样本数据相关联的变量,或将所述衍生变量作为与所述用户样本数据相关联的变量。


6.根据权利要求4所述的数据处理方法,其特征在于,基于与所述用户样本数据相关联的各个变量的值,确定所述各个变量对所述用户样本数据中的正样本数据和负样本数据的区分能力,包括:
针对与所述用户样本数据相关联的每个变量,根据所述用户样本数据中包含的所述每个变量的值将所述用户样本数据划分为多个第一样本集;
根据各个所述第一样本集中的正样本数量与负样本数量,以及所述用户样本数据中的正样本数量与负样本数量,确定所述每个变量对所述正样本数据和所述负样本数据的区分能力。


7.根据权利要求6所述的数据处理方法,其特征在于,根据各个所述第一样本集中的正样本数量与负样本数量,以及所述用户样本数据中的正样本数量与负样本数量,确定所述每个变量对所述正样本数据和所述负样本数据的区分能力,包括:
根据各个所述第一样本集中的正样本数量与负样本数量计算各个所述第一样本集中的正样本占比,根据所述用户样本数据中的正样本数量与负样本数量计算所述用户样本数据中的正样本占比;
根据各个所述第一样本集中的正样本占比与所述用户样本数据中的正样本占比之间的对比关系,确定各个所述第一样本集对应的参考因子;
根据各个所述第一样本集对应的参考因子,确定所述每个变量对所述正样本数据和所述负样本数据的区分能力。


8.根据权利要求1所述的数据处理方法,其特征在于,...

【专利技术属性】
技术研发人员:王相军黄承
申请(专利权)人:财付通支付科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1