一种互联网用户属性识别方法和装置制造方法及图纸

技术编号:15763137 阅读:456 留言:0更新日期:2017-07-06 00:08
本发明专利技术实施例公开了一种互联网用户属性识别方法和装置,获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。

Method and device for identifying attribute of Internet user

The embodiment of the invention discloses a method and apparatus for attribute recognition of Internet users, access label information, according to the label information generation label category tree, the tag information including at least category labels; according to the category level series label label on the label category encoding category according to the types of the category tree; class label type and behavior of Internet users to determine the label mapping rules; obtaining user behavior data, the corresponding category labels according to the label mapping rules for the user and set the label category tree.

【技术实现步骤摘要】
一种互联网用户属性识别方法和装置
本专利技术涉及互联网
,尤其涉及一种互联网用户属性识别方法和装置。
技术介绍
互联网用户浏览网站或使用手机软件的行为的时间是十分碎片化的,浏览时间也同样碎片化,这使得很多流量不大但质量不错的中小网站的广告位有了一定的市场。现有技术中,通常通过对用户上网行为分析、给用户打标签、以便针对性投放广告的方案。然而,现有技术中,给用户打标签的方案主要依赖数据挖掘模型,通常是对用户的偏好进行人工整理,再通过简单的host规则匹配,给用户标记的内容标签是比较有限的用户偏好标签,最终只会给用户标记上很少的几个标签,很难满足全面用户标签管理的需求。
技术实现思路
为解决上述技术问题,本专利技术实施例提供一种互联网用户属性识别方法和装置,可以更方便、更精准地给用户设定标签。本专利技术的技术方案是这样实现的:本专利技术实施例提供一种互联网用户属性识别方法,所述方法包括:获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。进一步地,所述获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签,包括:根据预设规则获取互联网上的每一个行业的静态页面信息,根据所述静态页面信息生成互联网信息表,从所述互联网信息表获取标签信息,所述标签信息至少包括类目级标签,根据所述类目级标签生成标签类目树。进一步地,所述类目级标签包括:至少一个父类目级标签和所述至少一个父类目级标签对应的子类目级标签,所述根据所述类目级标签的级数对所述标签类目树进行标签类目编码,包括:根据所述至少一个父类目级标签的预设编码对所述至少一个父类目级标签对应的子类目级标签进行编码,获得所述至少一个父类目级标签对应的子类目级标签的子类目编码;当所述至少一个父类目级标签增加新的子类目级标签时,确定所述至少一个父类目级标签对应的子类目编码是否超出预设范围;若所述至少一个父类目级标签对应的子类目编码未超出预设范围,将所述至少一个父类目级标签对应的子类目编码的个数加1获得新的子类目编码,其中,一个子类目级标签对应于至少一个父类目级标签。进一步地,所述标签信息还包括:产品级标签;所述方法还包括:将所述产品级标签添加到所述标签类目树中至少一个类目级标签对应的位置。进一步地,其特征在于,所述方法还包括:增加类目级标签和/或产品级标签更新所述标签类目树。进一步地,在所述根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则之后,还包括:根据所述标签映射规则生成标签规则表,其中,在所述标签规则表中,一个标签对应至少一个标签映射规则。本专利技术实施例还提供一种互联网用户属性识别装置,所述装置包括:获取单元、处理单元、确定单元,其中,所述获取单元,用于获取标签信息,所述标签信息至少包括类目级标签;所述处理单元,用于根据所述标签信息生成标签类目树,还用于根据所述类目级标签的级数对所述标签类目树进行标签类目编码;所述确定单元,用于根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;所述获取单元,还用于获取用户行为数据;所述处理单元,还用于根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。进一步地,所述获取单元,用于根据预设规则获取互联网上的每一个行业的静态页面信息;所述处理单元,用于根据所述静态页面信息生成互联网信息表,从所述互联网信息表获取标签信息,所述标签信息至少包括类目级标签,根据所述类目级标签生成标签类目树。进一步地,所述类目级标签包括:至少一个父类目级标签和所述至少一个父类目级标签对应的子类目级标签,所述处理单元,用于根据所述至少一个父类目级标签的预设编码对所述至少一个父类目级标签对应的子类目级标签进行编码,获得所述至少一个父类目级标签对应的子类目级标签的子类目编码;还用于当所述至少一个父类目级标签增加新的子类目级标签时,确定所述至少一个父类目级标签对应的子类目编码是否超出预设范围;还用于若所述至少一个父类目级标签对应的子类目编码未超出预设范围,将所述至少一个父类目级标签对应的子类目编码的个数加1获得新的子类目编码,其中,一个子类目级标签对应于至少一个父类目级标签。进一步地,所述标签信息还包括:产品级标签;所述处理单元,用于将所述产品级标签添加到所述标签类目树中至少一个类目级标签对应的位置。进一步地,所述处理单元,用于增加类目级标签和/或产品级标签更新所述标签类目树,其中,在所述标签规则表中,一个标签对应至少一个标签映射规则。进一步地,所述处理单元,用于根据所述标签映射规则生成标签规则表,其中,在所述标签规则表中,一个标签对应至少一个标签映射规则。本专利技术实施例提供了一种互联网用户属性识别方法和装置,获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。本专利技术实施例提供的互联网用户属性识别方法和装置,通过构建标签类目树及编码管理可以更方便地表示各级类目标签之间的关系,方便给用户设定标签,通过匹配不同标签类型和用户行为类型的标签映射规则,可以更精准地给用户设定标签,能够更全面、更准确、更高效地提供标签和用户订阅服务。附图说明图1为本专利技术实施例提供的互联网用户属性识别方法流程示意图一;图2为本专利技术实施例提供的互联网用户属性识别方法流程示意图二;图3为本专利技术实施例提供的互联网用户属性识别装置结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。实施例一本专利技术实施例提供一种互联网用户属性识别方法,如图1所示,该方法可以包括:步骤101、互联网用户属性识别装置获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签。具体的,互联网用户属性识别装置根据预设规则获取互联网上的每一个行业的静态页面信息,根据所述静态页面信息自动生成互联网信息表,例如,从汽车之家网站爬取的互联网信息表包括:每一款车的关键词信息,以及该车的url信息和页面的具体内容信息,然后,从所述互联网信息表获取标签信息,所述标签信息至少包括类目级标签,并根据所述类目级标签自动生成标签类目树。可选的,标签信息也可以通过手工整理。现有技术的标签体系通常是手工整理,通常是少量扁平的用户偏好标签;而本专利技术实施例的多层级标签体系,标签非常丰富,且是通过爬虫自动生成互联网信息表,再通过程序自动生成标签类目树。其中,所述预设规则可以根据需要获取的标签信息进行自定义设定,例如,当需要获取汽车行业的标签信息时,预设规则可以设定为与汽车行业相关的关键词信息,例如,汽车的级别、品牌、国别、车名、配置、价格等,根据该关键词信息从互联网上的静态页面信息获取汽车行业的标签信息。现有技术通常采用的是样本库数据;而本专利技术实施例采集的是全量互联网用本文档来自技高网...
一种互联网用户属性识别方法和装置

【技术保护点】
一种互联网用户属性识别方法,其特征在于,所述方法包括:获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。

【技术特征摘要】
1.一种互联网用户属性识别方法,其特征在于,所述方法包括:获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签;根据所述类目级标签的级数对所述标签类目树进行标签类目编码;根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则;获取用户行为数据,根据所述标签映射规则为所述用户设定与所述标签类目树中对应的类目级标签。2.根据权利要求1所述的方法,其特征在于,所述获取标签信息,根据所述标签信息生成标签类目树,所述标签信息至少包括类目级标签,包括:根据预设规则获取互联网上的每一个行业的静态页面信息,根据所述静态页面信息生成互联网信息表,从所述互联网信息表获取标签信息,所述标签信息至少包括类目级标签,根据所述类目级标签生成标签类目树。3.根据权利要求1或2所述的方法,其特征在于,所述类目级标签包括:至少一个父类目级标签和所述至少一个父类目级标签对应的子类目级标签,所述根据所述类目级标签的级数对所述标签类目树进行标签类目编码,包括:根据所述至少一个父类目级标签的预设编码对所述至少一个父类目级标签对应的子类目级标签进行编码,获得所述至少一个父类目级标签对应的子类目级标签的子类目编码;当所述至少一个父类目级标签增加新的子类目级标签时,确定所述至少一个父类目级标签对应的子类目编码是否超出预设范围;若所述至少一个父类目级标签对应的子类目编码未超出预设范围,将所述至少一个父类目级标签对应的子类目编码的个数加1获得新的子类目编码,其中,一个子类目级标签对应于至少一个父类目级标签。4.根据权利要求1所述的方法,其特征在于,所述标签信息还包括:产品级标签;所述方法还包括:将所述产品级标签添加到所述标签类目树中至少一个类目级标签对应的位置。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:增加类目级标签和/或产品级标签更新所述标签类目树。6.根据权利要求1所述的方法,其特征在于,在所述根据所述类目级标签的类型和互联网用户行为类型确定标签映射规则之后,还包括:根据所述标签映射规则生成标签规则表,其中,在所述标签规则表中,一个标签对应至少一个标签映射规则...

【专利技术属性】
技术研发人员:高丹赵耀红熊龙邓展成宋刚邓超冯俊兰顾志峰石世磊许闱纬彭传金
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1