用户数据处理方法、用户数据的提供方法和系统技术方案

技术编号:12161637 阅读:117 留言:0更新日期:2015-10-06 10:37
本发明专利技术实施例提供一种用户数据处理方法、用户数据的提供方法和系统,其中,基于用户网络行为的用户数据处理方法包括:获取用户的网络行为数据;分别通过至少一种用于识别用户属性的分类模型对用户的网络行为数据进行识别,获取用户的至少一个用户属性信息;将识别获取的用户的至少一个用户属性信息添加到所述用户的用户模型数据中。本发明专利技术的技术方案实现基于用户的网络行为获取和提供用户的属性信息。

【技术实现步骤摘要】

本专利技术设及信息处理技术,尤其设及一种用户数据处理方法、用户数据的提供方 法和系统。
技术介绍
致力于满足政府、企业针对网络舆情监控的需求,需要利用全网数据(包括微博, 贝占吧,新闻,论坛等)对热点事件、用户关屯、事件进行实时监控。在舆情监控中,除了舆情事 件本身,事件相关的人群数据也是需求者所重点关注的信息。随着当下人们的隐私意识越 发强烈,越来越少的用户会主动在网络上填写个人信息并且公开,因此如何准确地获取用 户的数据,便成为舆情监控中的一大难题。
技术实现思路
本专利技术的实施例提供一种用户数据处理方法、用户数据的提供方法和系统,W基 于用户的网络行为获取用户的属性信息。 为达到上述目的,本专利技术的实施例提供了一种基于用户网络行为的用户数据处理 方法,包括;获取用户的网络行为数据;分别通过至少一种用于识别用户属性的分类模型 对所述用户的网络行为数据进行识别,获取所述用户的至少一个用户属性信息;将识别获 取的所述用户的至少一个用户属性信息添加到所述用户的用户模型数据中。 进一步地,所述用户的用户模型数据包括用户的标识信息W及至少一个所述用户 属性信息。 可选地,所述方法还包括;从所述用户的网络行为数据提取关键词,根据提取的关 键词选择用于识别用户属性的所述分类模型。 进一步地,所述用户属性信息包括年龄、性别、地域、兴趣、所属行业当中的至少一 个。[000引本专利技术的实施例还提供了一种用户数据的提供方法,包括;获取用户的网络行为 数据;根据所述用户的第一用户标识从用户标识映射表中获取所述用户的第二用户标识, 其中,所述用户标识映射表关联记录有用户的多个用户标识;根据所述第二用户标识获取 所述用户的用户模型数据,所述用户模型数据包括所述用户的至少一个用户属性信息。 可选地,所述方法还包括;从所述网络行为数据中获取所述用户的第一用户标识。 进一步地,所述用户标识映射表关联记录的多个用户标识包括至少两个W下标 识產少一个用户的注册账号、MAC地址、被叫用户识别号CUID W及国际移动设备识别码 IMEIo 本专利技术的实施例还提供了一种基于用户网络行为的用户数据处理系统,包括:数 据获取模块,用于获取用户的网络行为数据;数据识别模块,用于分别通过至少一种用于识 别用户属性的分类模型对所述用户的网络行为数据进行识别,获取所述用户的至少一个用 户属性信息;信息添加模块,用于将识别获取的所述用户的至少一个用户属性信息添加到 所述用户的用户模型数据中。 进一步地,所述用户的用户模型数据包括用户的标识信息W及至少一个所述用户 属性信息。 可选地,所述系统还包括;模型选取模块,用于从所述用户的网络行为数据提取关 键词,根据提取的关键词选择用于识别用户属性的所述分类模型。 进一步地,所述用户属性信息包括年龄、性别、地域、兴趣、所属行业当中的至少一 个。 本专利技术的实施例还提供了一种用户数据的提供系统,包括;数据获取模块,用于获 取用户的网络行为数据;用户标识获取模块,用于根据所述用户的第一用户标识从用户标 识映射表中获取所述用户的第二用户标识,其中,所述用户标识映射表关联记录有用户的 多个用户标识;用户模型数据获取模块,用于根据所述第二用户标识获取所述用户的用户 模型数据,所述用户模型数据包括所述用户的至少一个用户属性信息。 可选地,所述用户标识获取模块还用于从所述网络行为数据中获取所述用户的第 一用户标识。 进一步地,所述用户标识映射表关联记录的多个用户标识包括至少两个W下标 识產少一个用户的注册账号、MAC地址、被叫用户识别号CUID W及国际移动设备识别码 IMEIo 本专利技术实施例提供的基于用户网络行为的用户数据处理、用户数据的提供方法和 系统,利用可识别用户属性的分类模型对用户网络行为数据进行识别,得到包含至少一个 用户属性信息的用户模型数据;通过预置的用户标识映射表,对获取的新的用户的网络行 为数据中的用户标识进行识别,找到与该用户标识具有映射关系的用户标识,W进一步获 取与该映射的用户标识对应的用户模型数据。【附图说明】 图1为本专利技术提供的基于用户网络行为的用户数据处理方法一个实施例的方法 流程图; 图2为本专利技术提供的用户数据的提供方法一个实施例的方法流程图; 图3为本专利技术提供的基于用户网络行为的用户数据处理系统一个实施例的结构 不意图; 图4为本专利技术提供的基于用户网络行为的用户数据处理系统另一个实施例的结 构示意图; 图5为本专利技术提供的用户数据的提供系统一个实施例的结构示意图。【具体实施方式】 本专利技术的基本专利技术构思是,先通过已训练好的分类模型对用户的网络行为数据对 应的用户属性进行识别,得到与该用户对应的包含至少一个用户属性信息的用户模型数 据;然后利用该用户模型数据W及预先建立好的同一用户对应的多个用户标识的用户标识 映射表,在全网系统中对新获取的用户的网络行为数据的用户属性信息进行识别。 实施例一 图1为本专利技术提供的基于用户网络行为的用户数据处理方法一个实施例的方法 流程图,该方法的执行主体可W为具有数据处理功能的服务器。 参照图1,在步骤S110,获取用户的网络行为数据。[002引所述的用户的网络行为数据可W为用户在使用互联网络的行为操作中所产生的 相关数据,具体地,可W包括日志、cookies等数据。例如,用户捜索了 "联想",则该关键词 可W作为一项网络行为数据。类似的,用户在百度捜索后所点击的网站链接,W及在百度合 作的网站上的广告点击,都可W作为用户的网络行为数据。该些网络行为数据随着用户的 网络行为产生,并被网络浏览器或网络服务器保存下来。 在步骤S120,分别通过至少一种用于识别用户属性的分类模型对用户的网络行为 数据进行识别,获取用户的至少一个用户属性信息。 所述的分类模型为预先设置的用于识别用户属性信息的模型。其中,用户属性信 息可W包括用户的包括年龄、性别、地域、兴趣、所属行业当中的至少一个的信息。而针对 用户在不同维度下的用户属性信息,可采用不同的分类模型分别进行识别。每种分类模型 都可包含识别相应用户属性信息的关键词,利用该些关键词与用户的网络行为数据进行匹 配,则可识别出该用户最有可能的用户属性。 例如,针对"性别"维度下的用户属性信息的识别,在识别为女性的分类模型中采 用的关键词可W包括特别针对女性特殊行为的关键词,如"化妆品"、"美容"、"母婴"等;类 似的,针对"地域"维度下的用户属性信息的识别,在识别为某省/市的分类模型中采用的 关键词可W是包含在该省/市内的大部分地理名称。依此类推,通过至少一种分类模型下 的关键词可W获取用户的至少一个用户属性信息。[0当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种基于用户网络行为的用户数据处理方法,其特征在于,包括:获取用户的网络行为数据;分别通过至少一种用于识别用户属性的分类模型对所述用户的网络行为数据进行识别,获取所述用户的至少一个用户属性信息;将识别获取的所述用户的至少一个用户属性信息添加到所述用户的用户模型数据中。

【技术特征摘要】

【专利技术属性】
技术研发人员:邵睿沈剑平李炫莫洋宋元峰齐沁芳
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1