【技术实现步骤摘要】
数据处理方法及其系统
本公开涉及互联网
,更具体地,涉及一种数据处理方法及其系统、一种计算机系统和一种计算机可读存储介质。
技术介绍
随着互联网技术的快速发展,在不同的网站上,经常会出现拉新用户(即针对某一对象,增加操作该对象的用户量)的活动。但是全网站的拉新用户成本越来越高,因此,在用户拉新过程中,如何更好的根据用户对品类的操作数据圈定出有潜在能力的用户显得越来越重要。在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:相关技术中不加分析的直接使用操作数据拉新用户,导致对用户圈定不准,并且浪费了系统资源。
技术实现思路
有鉴于此,本公开提供了一种用于拉新用户的数据处理方法及其系统。本公开的一个方面提供了一种数据处理方法,包括获取样本数据,其中,上述样本数据包括样本用户群中各样本用户对指定品类进行操作时产生的操作数据;分析上述样本数据,并提取出特征样本数据,其中,上述特征样本数据包括影响上述样本用户群中的样本用户交换上述指定品类的关键操作数据;以及对提取的上述特征样本数据进行处理,以训练得到用于预测目标用户是否是上述指定品类的潜在用户的用户预测模 ...
【技术保护点】
一种数据处理方法,包括:获取样本数据,其中,所述样本数据包括样本用户群中各样本用户对指定品类进行操作时产生的操作数据;分析所述样本数据,并提取出特征样本数据,其中,所述特征样本数据包括影响所述样本用户群中的样本用户交换所述指定品类的关键操作数据;以及对提取的所述特征样本数据进行处理,以训练得到用于预测目标用户是否是所述指定品类的潜在用户的用户预测模型。
【技术特征摘要】
1.一种数据处理方法,包括:获取样本数据,其中,所述样本数据包括样本用户群中各样本用户对指定品类进行操作时产生的操作数据;分析所述样本数据,并提取出特征样本数据,其中,所述特征样本数据包括影响所述样本用户群中的样本用户交换所述指定品类的关键操作数据;以及对提取的所述特征样本数据进行处理,以训练得到用于预测目标用户是否是所述指定品类的潜在用户的用户预测模型。2.根据权利要求1所述的方法,其中,对提取的所述特征样本数据进行处理,以训练得到用于预测目标用户是否是所述指定品类的潜在用户的用户预测模型包括:对提取的所述特征样本数据进行归一化处理,得到归一化处理结果;将所述归一化处理结果输入预先设定的逻辑回归算法进行训练,得到训练结果;以及将所述训练结果作为所述用户预测模型。3.根据权利要求1或2所述的方法,其中,所述方法还包括:在训练出所述用户预测模型之后,计算所述用户预测模型的均方误差;根据计算得到的所述均方误差判断所述用户预测模型的质量是否满足预设条件;以及若所述用户预测模型的质量不满足预设条件,则调整所述用户预测模型的相关参数或者调整所述特征样本数据,以得到优化后的用户预测模型。4.根据权利要求1所述的方法,其中,所述方法还包括:在训练得到所述用户预测模型之后,获取预测数据,其中,所述预测数据包括待预测用户群中各待预测用户对所述指定品类进行操作时产生的操作数据;从所述预测数据中提取特征预测数据;以及将提取的特征预测数据输入所述用户预测模型,以从所述各待预测用户中确定出所述指定品类的对应的潜在用户。5.根据权利要求4所述的方法,其中,所述方法还包括:在确定出所述对应的潜在用户之后,确定所述指定品类的关联品类;确定所述关联品类的活跃用户;以及将确定出的活跃用户也作为对应的潜在用户。6.一种数据处理系统,包括:第一获取模块,用于获取样本数据,其中,所述样本数据包括样本用户群中各样本用户对指定品类进行操作时产生的操作数据;分析模块,用于分析所述样本数据,并提取出特征样本数据,其中,所述特征样本数据包括影响所述样本用户群...
【专利技术属性】
技术研发人员:秦炜,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。