【技术实现步骤摘要】
用户身份识别方法、装置、系统及存储介质
[0001]本专利技术实施例涉及计算机
,尤其涉及一种用户身份识别方法、装置、系统及存储介质。
技术介绍
[0002]高校学生用户在全国约有2700万人,学生群体具有上网时间长,收入低,消费需求旺盛等特点。目前许多互联网企业的业务进入到精细化运营的阶段后,需要对客户进行尽可能地细,分以因客施策。另一方面,当开展的业务可能包含学生群体时,也需要考虑到其特殊的身份,设计专门的规则或策略以规避潜在风险。
[0003]目前对于学生身份识别,普遍有两种思路:
[0004]1)分析用户的收货地址,基于收货地址的分类结合年龄信息进行判断;
[0005]2)结合用户在App浏览的页面、下单等行为序列进行建模,进而通过模型识别。
[0006]方案1中强依赖于人工经验设计规则,能够考虑的因子受限于人类对信息处理的物理上限。仅通过地址文本识别的学生客群数量偏低,具有较大的提升瓶颈;方案2使用浏览、订单等信息特异性较弱,存在学生客群识别效果较差,模型很难获得较好的区分性。 ...
【技术保护点】
【技术特征摘要】
1.一种用户身份识别方法,其特征在于,所述方法包括:获取用户的多个位置数据,以及所述多个位置数据的产生时间;根据所述多个位置数据和所述产生时间,对所述多个位置数据进行降维处理,获取多个位置时间序列;根据所述位置时间序列,确定所述位置时间序列中的位置数据出现在目标区域的次数占比;获取用户年龄数据和订单数据,从所述订单数据中提取消费特征,以及收货地址;确定所述收货地址中属于所述目标区域的地址数量,与所述目标区域总数量的数量占比;根据所述年龄数据、所述消费特征、所述次数占比以及所述数量占比,识别所述用户身份。2.根据权利要求1所述的方法,其特征在于,根据所述多个位置数据和所述产生时间,对所述多个位置数据进行降维处理,获取多个位置时间序列,具体包括:按照网格形式对地理区域进行划分,获取多个子区域;按照所述多个子区域,对所述多个位置数据进行分组,将属于同一个子区域的位置数据划分为一个位置组,并确定代表所述位置组的位置的第一代理数据;按照时间窗形式,将所述产生时间划分为多个时间组;将属于所述同一个时间组的多个第一代理数据构成一个位置时间序列,进而获取多个位置时间序列。3.根据权利要求2所述的方法,其特征在于,所述根据所述多个位置数据和所述产生时间,对所述多个位置数据进行降维处理,获取多个位置时间序列之后,所述方法还包括:从所述多个位置时间序列中剔除噪声序列,其中所述噪声序列包括如下中的一种或多种:属于同一时间组中包括的第一代理数据数量超过第一预设数量阈值;或者属于同一时间组中位置数据的数量小于第二预设数量阈值。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述位置时间序列,确定所述位置时间序列中的位置数据出现在目标区域的次数占比之前,所述方法还包括:获取包括目标区域的收货地址样本信息以及与所述收货地址样本信息对应的位置样本数据;根据所述收货地址样本信息,对所述位置样本数据进行聚类,获取经过至少一个聚类簇;分别对每一个聚类簇内的位置样本数据进行网格划分,划分为样本区域;确定每一个样本区域的第二代理数据,并将所述第二代理数据标记所述目标区域的标签。5.根据权利要求4所述的方法,其特征在于,根据所述位置时间序列,统计所述位置时间序列中的位置数据出现在目标区域的次数,具体包括:将所述位置时间序列中的第一代理数据与所述目标区域中的第二代理数据进行匹配;当所述位置时...
【专利技术属性】
技术研发人员:魏睐,孙果,彭南博,
申请(专利权)人:京东科技控股股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。