The embodiment of the invention discloses a method and apparatus for attribute recognition of Internet users, access label information, according to the label information generation label category tree, the tag information including at least category labels; according to the category level series label label on the label category encoding category according to the types of the category tree; class label type and behavior of Internet users to determine the label mapping rules; obtaining user behavior data, the corresponding category labels according to the label mapping rules for the user and set the label category tree.
【技术实现步骤摘要】
一种互联网用户属性识别方法和装置
本专利技术涉及互联网
,尤其涉及一种互联网用户属性识别方法和装置。
技术介绍
互联网用户浏览网站或使用手机软件的行为的时间是十分碎片化的,浏览时间也同样碎片化,这使得很多流量不大但质量不错的中小网站的广告位有了一定的市场。现有技术中,通常通过对用户上网行为分析、给用户打标签、以便针对性投放广告的方案。然而,现有技术中,给用户打标签的方案主要依赖数据挖掘模型,通常是对用户的偏好进行人工整理,再通过简单的host规则匹配,给用户标记的内容标签是比较有限的用户偏好标签,最终只会给用户标记上很少的几个标签,很难满足全面用户标签管理的需求。
技术实现思路
为解决上述技术问题,本专利技术实施例提供一种互联网用户属性识别方法和装置,可以更方便、更精准地给用户设定标签。本专利技术的技术方案是这样实现的:本专利技术实施例提供一种互联网用户属性识别方法,所述方法包括:获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。进一步地,所述获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签,包括:根据预设规则获取互联网上的每一个行业的静态页面信息,根据所述静态页面信息生成互联网信息表,从所述互联网信息表获取标签信息,所述标签信息至少包括类目级标签,根据所述类目级标签生成标签类目树。进一步地,所 ...
【技术保护点】
一种互联网用户属性识别方法,其特征在于,所述方法包括:获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。
【技术特征摘要】
1.一种互联网用户属性识别方法,其特征在于,所述方法包括:获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。2.根据权利要求1所述的方法,其特征在于,所述获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签,包括:根据预设规则获取互联网上的每一个行业的静态页面信息,根据所述静态页面信息生成互联网信息表,从所述互联网信息表获取标签信息,所述标签信息至少包括类目级标签,根据所述类目级标签生成标签类目树。3.根据权利要求1或2所述的方法,其特征在于,所述类目级标签包括:至少一个父类目级标签和所述至少一个父类目级标签对应的子类目级标签,所述根据所述类目级标签的级数对所述标签类目树进行标签类目编码,包括:根据所述至少一个父类目级标签的预设编码对所述至少一个父类目级标签对应的子类目级标签进行编码,获得所述至少一个父类目级标签对应的子类目级标签的子类目编码;当所述至少一个父类目级标签增加新的子类目级标签时,确定所述至少一个父类目级标签对应的子类目编码是否超出预设范围;若所述至少一个父类目级标签对应的子类目编码未超出预设范围,将所述至少一个父类目级标签对应的子类目编码的个数加1获得新的子类目编码,其中,一个子类目级标签对应于至少一个父类目级标签。4.根据权利要求1所述的方法,其特征在于,所述标签信息还包括:产品级标签;所述方法还包括:将所述产品级标签添加到所述标签类目树中至少一个类目级标签对应的位置。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:增加类目级标签和/或产品级标签更新所述标签类目树。6.根据权利要求1所述的方法,其特征在于,在所述根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则之后,还包括:根据所述标签映射规则生成标签规则表,其中,在所述标签规则表中,一个标签对应至少一个标签映射规则...
【专利技术属性】
技术研发人员:高丹,赵耀红,熊龙,邓展成,宋刚,邓超,冯俊兰,顾志峰,石世磊,许闱纬,彭传金,
申请(专利权)人:中国移动通信集团公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。