目标用户识别模型建立、目标用户识别方法及装置制造方法及图纸

技术编号:20161562 阅读:30 留言:0更新日期:2019-01-19 00:14
本发明专利技术实施例公开了一种目标用户识别模型建立、目标用户识别方法及装置。目标用户识别模型建立方法包括:获取至少两个用户的历史拉新活动信息;提取与历史拉新活动信息关联的注册数据信息;采用二元分类器算法,根据与历史拉新活动信息对应的用户类型及注册数据信息,对设定预测模型进行训练,生成目标用户识别模型,之后获取待识别用户的注册数据信息,将注册数据信息输入至预先训练的目标用户识别模型中,判断待识别用户是否为目标用户,可以有效解决现有技术中无法准确识别薅羊毛用户的技术问题,充分利用能够真实反映用户是否为薅羊毛用户的历史拉新活动信息,优化现有的薅羊毛用户识别技术,提高薅羊毛用户识别的准确性及时效性。

【技术实现步骤摘要】
目标用户识别模型建立、目标用户识别方法及装置
本专利技术实施例涉及信息处理技术,尤其涉及一种目标用户识别模型建立、目标用户识别方法及装置。
技术介绍
随着互联网行业的快速发展,运营商为了推广自己的网站,通常会组织大量的拉新活动,即针对新用户定制优惠活动,使新用户通过注册账号成为网站的用户,以使用户能够进行后续消费,扩大业务量。但目前,有部分用户注册账号通过网络平台活动获取大量的活动奖励后,再也不访问或登录该网络平台,我们称这部分用户为薅羊毛用户。薅羊毛用户即是发现哪个网络平台有活动,就去注册账号,甚至投资,以获取奖励的钱或礼物的用户。这些薅羊毛用户的存在严重破坏了网络平台搞活动的本身目的,侵占了大量的活动资源,不利于网络平台的健康发展。因此,需要提供一种识别薅羊毛用户的方法。现有技术中,识别薅羊毛用户的方法主要包括薅羊毛用户黑名单机制和对薅羊毛用户的简单限制规则。其中,薅羊毛用户黑名单机制是将根据历史用户注册数据确定的薅羊毛用户加入薅羊毛用户黑名单。这种方案的缺陷是:用户可以重新注册一个新的账号,摆脱薅羊毛用户黑名单的限制;而且薅羊毛用户黑名单机制具有滞后性,容易被薅羊毛用户浪费大量的资源。而对薅羊毛用户的简单限定规则主要是:在大量的网络拉新活动中,对注册账号进行限定,如同一个注册账号、同一个手机号或同一个收货地址只能注册一次。该方案的主要缺点为:限制条件涉及的主观因素比较多,而且限制规则较简单,无法限定大量的薅羊毛用户团体。
技术实现思路
本专利技术实施例提供一种目标用户识别模型建立、目标用户识别方法及装置,以优化现有的薅羊毛用户识别技术,提高薅羊毛用户识别的准确性及时效性。第一方面,本专利技术实施例提供了一种目标用户识别模型建立方法,该方法包括:获取至少两个用户的历史拉新活动信息;提取与所述历史拉新活动信息关联的注册数据信息;采用二元分类器算法,根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息,对设定预测模型进行训练,生成目标用户识别模型,其中,所述用户类型包括目标用户和非目标用户。第二方面,本专利技术实施例还提供了一种目标用户识别方法,该方法包括:获取待识别用户的注册数据信息;将所述注册数据信息输入至预先训练的目标用户识别模型中,获取所述待识别用户的识别结果,其中,所述目标用户识别模型由与至少两个用户的历史拉新活动信息关联的注册数据信息以及与所述历史拉新活动信息对应的用户类型训练生成;根据所述识别结果判断所述待识别用户是否为目标用户。第三方面,本专利技术实施例还提供了一种目标用户识别模型建立装置,该装置包括:活动信息获取模块,用于获取至少两个用户的历史拉新活动信息;注册数据信息提取模块,用于提取与所述历史拉新活动信息关联的注册数据信息;目标用户识别模型生成模块,用于采用二元分类器算法,根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息,对设定预测模型进行训练,生成目标用户识别模型,其中,所述用户类型包括目标用户和非目标用户。第四方面,本专利技术实施例还提供了一种目标用户识别装置,该装置包括:注册数据信息获取模块,用于获取待识别用户的注册数据信息;识别结果获取模块,用于将所述注册数据信息输入至预先训练的目标用户识别模型中,获取所述待识别用户的识别结果,其中,所述目标用户识别模型由与至少两个用户的历史拉新活动信息关联的注册数据信息以及与所述历史拉新活动信息对应的用户类型训练生成;目标用户判断模块,用于根据所述识别结果判断所述待识别用户是否为目标用户。本专利技术实施例通过获取至少两个用户的历史拉新活动信息;提取与历史拉新活动信息关联的注册数据信息;采用二元分类器算法,根据与历史拉新活动信息对应的用户类型及注册数据信息,对设定预测模型进行训练,生成目标用户识别模型,其中,用户类型包括目标用户和非目标用户,之后在判断用户是否为目标用户时,获取待识别用户的注册数据信息,将注册数据信息输入至预先训练的目标用户识别模型中,判断待识别用户是否为目标用户的技术手段,可以有效解决现有技术中无法准确识别薅羊毛用户的技术问题,充分利用能够真实反映用户是否为薅羊毛用户的历史拉新活动信息,优化现有的薅羊毛用户识别技术,提高薅羊毛用户识别的准确性及时效性。附图说明图1是本专利技术实施例一提供的一种目标用户识别模型建立方法的流程图;图2是本专利技术实施例二提供的一种目标用户识别模型建立方法的流程图;图3是本专利技术实施例三提供的一种目标用户识别方法的流程图;图4是本专利技术实施例四提供的一种目标用户识别模型建立装置的结构示意图;图5是本专利技术实施例五提供的一种目标用户识别装置的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种目标用户识别模型建立方法的流程图,本实施例的方法可以由目标用户识别模型建立装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可集成于完成目标用户识别模型建立功能的建模服务器中,与存放用户参与拉新活动数据的数据服务器配合使用,其中,建模服务器和数据服务器可以为同一服务器或者属于同一服务器集群,也可以为不同的服务器,本实施例对此并不进行限制。本实施例的方法具体包括:S101、获取至少两个用户的历史拉新活动信息。在本实施例中,用户的历史拉新活动信息是指用户参与网络平台拉新活动中,用户注册账号或用户登录网络平台浏览或购买的历史数据信息。其中,历史拉新活动可以是各个网络平台为了推广自己的网站而针对新用户制定个各种优惠活动,如饿了么、美团外卖反馈给新用户的订餐优惠劵,又如新用户下载并注册某软件APP后,APP软件赠送的数额不等的现金红包。用户在参与各种拉新活动的过程中,在注册账号时,会绑定各种个人信息,如用户账号名称、用户账号密码、用户联系方式、用户收货地址等,这些信息被存储在网络平台服务器中,构成用户的历史拉新活动信息。S102、提取与历史拉新活动信息关联的注册数据信息。在本实施例中,从用户的历史拉新活动信息中提取与之关联的注册数据信息。其中,注册数据信息可以包括用户账号相似度、用户密码重复次数、用户联系方式重复次数、收货人重复次数、用户收货地址重复次数、用户注册时间与活动上线时间差中的至少一个。其中,用户账号相似度反映的是用户在参与拉新活动的过程中,进行账号注册时,用户的账号名称与其他用户账号名称的相似性。其中,可以通过余弦相似度来计算当前用户的账号名称与大量历史拉新活动中其他各个用户账号名称的相似性,并将当前用户的账号名称与历史拉新活动中其他各个账号名称中的余弦相似度的最大值作为当前用户的账号相似度。用户密码重复次数是指用户在参与拉新活动账号注册时,为账号设定的账号密码与大量历史拉新活动中其他用户账号密码的重复次数。用户联系方式重复次数是指用户在参与拉新活动账号注册时,预留的联系方式与大量历史拉新活动中其他用户留下的联系方式的重复次数。收货人重复次数是指用户预留的收货人姓名与大量历史拉新活动中其他用户留下的收货人姓名重复的次数。用户收货地址重复次数是指用户预留的收货地址与大量历史拉新活动中其他用户留下的收货地址的本文档来自技高网...

【技术保护点】
1.一种目标用户识别模型建立方法,其特征在于,包括:获取至少两个用户的历史拉新活动信息;提取与所述历史拉新活动信息关联的注册数据信息;采用二元分类器算法,根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息,对设定预测模型进行训练,生成目标用户识别模型,其中,所述用户类型包括目标用户和非目标用户。

【技术特征摘要】
1.一种目标用户识别模型建立方法,其特征在于,包括:获取至少两个用户的历史拉新活动信息;提取与所述历史拉新活动信息关联的注册数据信息;采用二元分类器算法,根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息,对设定预测模型进行训练,生成目标用户识别模型,其中,所述用户类型包括目标用户和非目标用户。2.根据权利要求1所述的方法,其特征在于,所述注册数据信息包括用户账号相似度、用户密码重复次数、用户联系方式重复次数、收货人重复次数、用户收货地址重复次数、用户注册时间与活动上线时间差中的至少一个。3.根据权利要求1所述的方法,其特征在于,所述历史拉新活动信息还包括:用户参与活动数据信息;所述采用二元分类器算法,根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息,对设定预测模型进行训练,生成目标用户识别模型,包括:采用二元分类器算法,根据与所述历史拉新活动信息对应的用户类型、所述注册数据信息及所述用户参与活动数据信息,对设定预测模型进行训练,生成目标用户识别模型。4.根据权利要求3所述的方法,其特征在于,所述用户参与活动数据信息包括:用户参与活动总时长、用户下单前浏览网页页面总量、用户在活动页面停留总时长中的至少一个。5.根据权利要求1-4任一所述的方法,其特征在于,所述设定预测模型为逻辑回归模型。6.一种目标用户识别方法,其特征在于,包括:获取待识别用户的注册数据信息;将所述注册数据信息输入至预先训练的目标用户识别模型中,获取所述待识别用户的识别结果,其中,所述目标用户识别模型由与至少两个用户的历史拉新活动信息关联的注册数据信息以及与所述历史拉新活动信息对应的用户类型训练生成;根据所述识别结果判断所述待识别用户是否为目标用户。7.根据权利要求6所述的方法,其特征在于,所述注册数据信息包括用户账号相似度、用户密码重复次数、用户联系方式重复次数、收货人重复次数、用户收货地址重复次数、用户注册时间与活动上线时间差中的至少一个。8.根据权利要求6或7所述的方法,其特征在于,所述目标用户识别模型的输入参数还包括:用户参与活动数据信息;其中,所述用户参与活动数据信息包括用户参与活动总时长、用户下单前浏览网页页面总量、用户在活动页面停留总时长中的至少一个。9.一种目标用户识别模型建立装置,...

【专利技术属性】
技术研发人员:吴志坚
申请(专利权)人:深圳乐信软件技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1