目标用户识别模型建立、目标用户识别方法及装置制造方法及图纸

技术编号：20161562 阅读：30 留言：0更新日期：2019-01-19 00:14

本发明专利技术实施例公开了一种目标用户识别模型建立、目标用户识别方法及装置。目标用户识别模型建立方法包括：获取至少两个用户的历史拉新活动信息；提取与历史拉新活动信息关联的注册数据信息；采用二元分类器算法，根据与历史拉新活动信息对应的用户类型及注册数据信息，对设定预测模型进行训练，生成目标用户识别模型，之后获取待识别用户的注册数据信息，将注册数据信息输入至预先训练的目标用户识别模型中，判断待识别用户是否为目标用户，可以有效解决现有技术中无法准确识别薅羊毛用户的技术问题，充分利用能够真实反映用户是否为薅羊毛用户的历史拉新活动信息，优化现有的薅羊毛用户识别技术，提高薅羊毛用户识别的准确性及时效性。

全部详细技术资料下载

【技术实现步骤摘要】
目标用户识别模型建立、目标用户识别方法及装置
本专利技术实施例涉及信息处理技术，尤其涉及一种目标用户识别模型建立、目标用户识别方法及装置。
技术介绍
随着互联网行业的快速发展，运营商为了推广自己的网站，通常会组织大量的拉新活动，即针对新用户定制优惠活动，使新用户通过注册账号成为网站的用户，以使用户能够进行后续消费，扩大业务量。但目前，有部分用户注册账号通过网络平台活动获取大量的活动奖励后，再也不访问或登录该网络平台，我们称这部分用户为薅羊毛用户。薅羊毛用户即是发现哪个网络平台有活动，就去注册账号，甚至投资，以获取奖励的钱或礼物的用户。这些薅羊毛用户的存在严重破坏了网络平台搞活动的本身目的，侵占了大量的活动资源，不利于网络平台的健康发展。因此，需要提供一种识别薅羊毛用户的方法。现有技术中，识别薅羊毛用户的方法主要包括薅羊毛用户黑名单机制和对薅羊毛用户的简单限制规则。其中，薅羊毛用户黑名单机制是将根据历史用户注册数据确定的薅羊毛用户加入薅羊毛用户黑名单。这种方案的缺陷是：用户可以重新注册一个新的账号，摆脱薅羊毛用户黑名单的限制；而且薅羊毛用户黑名单机制具有滞后性，容易被薅羊毛用户浪费大量的资源。而对薅羊毛用户的简单限定规则主要是：在大量的网络拉新活动中，对注册账号进行限定，如同一个注册账号、同一个手机号或同一个收货地址只能注册一次。该方案的主要缺点为：限制条件涉及的主观因素比较多，而且限制规则较简单，无法限定大量的薅羊毛用户团体。
技术实现思路
本专利技术实施例提供一种目标用户识别模型建立、目标用户识别方法及装置，以优化现有的薅羊毛用户识别技术，提高薅羊毛用户识别...

【技术保护点】
1.一种目标用户识别模型建立方法，其特征在于，包括：获取至少两个用户的历史拉新活动信息；提取与所述历史拉新活动信息关联的注册数据信息；采用二元分类器算法，根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息，对设定预测模型进行训练，生成目标用户识别模型，其中，所述用户类型包括目标用户和非目标用户。

【技术特征摘要】
1.一种目标用户识别模型建立方法，其特征在于，包括：获取至少两个用户的历史拉新活动信息；提取与所述历史拉新活动信息关联的注册数据信息；采用二元分类器算法，根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息，对设定预测模型进行训练，生成目标用户识别模型，其中，所述用户类型包括目标用户和非目标用户。2.根据权利要求1所述的方法，其特征在于，所述注册数据信息包括用户账号相似度、用户密码重复次数、用户联系方式重复次数、收货人重复次数、用户收货地址重复次数、用户注册时间与活动上线时间差中的至少一个。3.根据权利要求1所述的方法，其特征在于，所述历史拉新活动信息还包括：用户参与活动数据信息；所述采用二元分类器算法，根据与所述历史拉新活动信息对应的用户类型及所述注册数据信息，对设定预测模型进行训练，生成目标用户识别模型，包括：采用二元分类器算法，根据与所述历史拉新活动信息对应的用户类型、所述注册数据信息及所述用户参与活动数据信息，对设定预测模型进行训练，生成目标用户识别模型。4.根据权利要求3所述的方法，其特征在于，所述用户参与活动数据信息包括：用户参与活动总时长、用户下单前浏览网页页面总量、用户在活动页面停留总时长中的至少一个。5.根据权利要求1-4任一所述的方法，其特征在于，所述设定预测模型为逻辑回归模型。6.一种目标用户识别方法，其特征在于，包括：获取待识别用户的注册数据信息；将所述注册数据信息输入至预先训练的目标用户识别模型中，获取所述待识别用户的识别结果，其中，所述目标用户识别模型由与至少两个用户的历史拉新活动信息关联的注册数据信息以及与所述历史拉新活动信息对应的用户类型训练生成；根据所述识别结果判断所述待识别用户是否为目标用户。7.根据权利要求6所述的方法，其特征在于，所述注册数据信息包括用户账号相似度、用户密码重复次数、用户联系方式重复次数、收货人重复次数、用户收货地址重复次数、用户注册时间与活动上线时间差中的至少一个。8.根据权利要求6或7所述的方法，其特征在于，所述目标用户识别模型的输入参数还包括：用户参与活动数据信息；其中，所述用户参与活动数据信息包括用户参与活动总时长、用户下单前浏览网页页面总量、用户在活动页面停留总时长中的至少一个。9.一种目标用户识别模型建立装置，...

【专利技术属性】
技术研发人员：吴志坚，
申请(专利权)人：深圳乐信软件技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人