网络流量的数据处理方法及装置制造方法及图纸

技术编号:11616328 阅读:115 留言:0更新日期:2015-06-17 15:56
本发明专利技术涉及一种网络流量的数据处理方法及装置,所述方法包括:从网络流量数据中获取超文本传输协议HTTP头信息和用户账户信息,所述用户账户信息包括用户的手机号码或者上网账号;从所述HTTP头信息中提取用户访问的网站的网络跟踪器cookie信息;将所述cookie信息与所述用户账户信息进行关联,并保存至用户信息数据库,其中,一个所述用户账户信息与至少一个网站的所述cookie信息相关联。本发明专利技术可以收集不同网站的cookie信息,可以更完整、准确地收集用户行为数据。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种网络流量的数据处理方法及装置
技术介绍
随着互联网的发展,越来越多的用户通过互联网查找自己想要的信息,同时也在 互联网上留下大量的用户行为数据。该些数据对电子商务、社区等类型的网站来说,是一块 非常有价值的财富,但是如何准确、全面获取用户的该些数据,是一个比较困难的问题。cookie是网站或应用程序为了辨别用户身份、进行会话session跟踪、提高访问 性能而储存在用户本地终端上的数据。现有获取用户行为数据的方法,一般为网站通过网 络跟踪器cookie来进行跟踪和记录用户行为,广告中间商(demandsideplat化rm,DSP)根 据超文本传输协议(Hype;rtexttransferprotocol,HTTP)协议采集用户的cookie数据, 通过cookie关联数据,DSP无需知道用户的手机号码,可W避免安全隐私问题。DSP将关联 好的数据进行用户数据的交易,提供给电子商务等网站。 然而,出于安全性的考虑,cookie只能针对一个网站域名生效,不同网站之间 不能共享cookie数据,每个应用程序只能获取自己的cookie,无法读取其他应用程序的 cookie,而且,cookie不能保持连续,例如:一个人清除电脑cookie后就不能连续识别该个 用户了。因而现有的方法无法全面了解用户的行为,无法跟踪用户的完整行为。
技术实现思路
本专利技术提供一种网络流量的数据处理方法及装置,能够完整地跟踪用户的行为, 全面了解用户的行为。 本专利技术第一方面提供了一种网络流量的数据处理方法,所述方法包括: 从网络流量数据中获取超文本传输协议HTTP头信息和用户账户信息,所述用户 账户信息包括用户的手机号码或者上网账号; 从所述HTTP头信息中提取用户访问的网站的网络跟踪器cookie信息,将所述 cookie信息与所述用户账户信息进行关联,并保存至用户信息数据库,其中,一个所述用户 账户信息与至少一个网站的所述cookie信息相关联。 结合第一方面,在第一方面的第一种可能的实施方式中,所述从所述HTTP头信息 中提取用户访问的网站的网络跟踪器cookie信息,具体包括: 根据预先配置的网站列表,从所述HTTP头信息中提取所述网站列表中的网站的 所述cookie信息。 结合第一方面或第一方面的第一种可能的实施方式,在第一方面的第二种可能的 实施方式中,所述cookie信息包括用户访问的网站信息、用户在访问的网站中的身份标识 cookieID和/或用户在访问的网站中的用户数据。 结合第一方面,在第一方面的第H种可能的实施方式中,在所述从网络流量数据 中获取HTTP头信息和用户账户信息之前,还包括: 从所述网络流量数据中解析得到用户访问的网站; 验证所述用户访问的网站是否已经签订安全协议,如果是,则执行所述从网络流 量数据中获取HTTP头信息和用户信息。 结合第一方面,在第一方面的第四种可能的实施方式中,在所述用户信息数据库 中,如果多个所述用户账户信息属于同一个用户,则将属于同一个用户的多个所述用户账 户信息进行关联。 结合第一方面或第一方面的第一种至第四种任一可能的实施方式,在第一方面的 第五种可能的实施方式中,所述方法还包括: 当接收到HTTP请求时,获取所述HTTP请求中的cookie信息; 从所述用户信息数据库中匹配得到与所述HTTP请求中的cookie信息相关联的用 户账户信息,并提取得到与所述用户账户信息相关联的用户数据。 结合第一方面的第五种可能的实施方式,在第一方面的第六种可能的实施方式 中,在所述提取得到与所述用户账户信息相关联的用户数据之后,还包括: 将所述用户数据提供给所述HTTP请求中访问的网站,W便所述网站根据所述用 户数据,将符合该用户偏好的内容组装成广告内容推送给所述用户。 第二方面,本专利技术还提供了一种网络流量的数据处理装置,所述装置包括: 第一处理模块,用于从网络流量数据中获取HTTP头信息和用户账户信息,所述用 户账户信息包括用户的手机号码或者上网账号; 信息提取模块,用于从所述第一处理模块获取的所述HTTP头信息中提取网络跟 踪器cookief旨息; 信息管理模块,用于将所述信息提取模块提取的所述cookie信息与所述第一处 理模块获取的所述用户账户信息进行关联,并保存至用户信息数据库,其中,一个所述用户 账户信息与至少一个所述cookie信息相关联。 结合第二方面,在第二方面的第一种可能的实施方式中,所述信息提取模块具体 用于根据预先配置的网站列表,从所述第一处理模块获取的所述HTTP头信息中提取所述 网站列表中的网站的所述cookie信息。 结合第二方面或第二方面的第一种可能的实施方式,在第二方面的第二种可能的 实施方式中,所述cookie信息包括用户访问的网站信息、用户在访问的网站中的身份标识 cookieID和/或用户在访问的网站中的用户数据。 结合第二方面,在第二方面的第H种可能的实施方式中,所述第一处理模块还用 于从所述网络流量数据中解析得到用户访问的网站; 所述装置还包括: 验证模块,用于验证所述第一处理模块解析得到的所述用户访问的网站是否已经 签订安全协议,如果是,则进入所述信息提取模块。 结合第二方面,在第二方面的第四种可能的实施方式中,所述信息管理模块还用 于判断所述用户信息数据库中的多个所述用户账户信息是否属于同一个用户,如果多个 所述用户账户信息属于同一个用户,则将属于同一个用户的多个所述用户账户信息进行关 联。 结合第二方面或第二方面的第一种至第四种任一可能的实施方式,在第二方面的 第五种可能的实施方式中,所述装置还包括: 第二处理模块,用于当接收到HTTP请求时,获取所述HTTP请求中的cookie信息; 匹配模块,用于从所述用户信息数据库中匹配得到与所述第二处理模块获取的所 述cookie信息相关联的用户账户信息,并提取得到与所述用户账户信息相关联的用户数 据。 结合第二方面的第五种可能的实施方式,在第二方面的第六种可能的实施方式 中,所述装置还包括: 发送模块,用于将所述匹配模块得到的所述用户数据提供给所述HTTP请求中访 问的网站,W便所述网站根据所述匹配模块得到的所述用户数据,将符合该用户偏好的内 容组装成广告内容推送给所述用户。 本专利技术提供的网络流量的数据处理方法及装置,通过解析用户的HTTP流量数据, 从网络流量数据中针对不同网站提取网站的cookie,将cookie信息与用户手机号码或上 网账号相关联,根据手机号码或上网账号从用户数据库中找出不同网站的任意cookie对 应的用户数据,可W更完整、准确地收集用户行为数据。【附图说明】 图1是本专利技术实施例一提供的网络流量的数据处理的一种应用场景; 图2为本专利技术实施例一提供的网络流量的数据处理方法流程图; 图3为本专利技术实施例一提供的网络流量的数据处理方法流程图; 图4为本专利技术实施例二提供的网络流量的数据处理装置示意图; 图5为本专利技术实施例二提供的网络流量的数据处理装置示意图; 图6是本专利技术实施例H提供的网络流量的数据处理装置的组成结构示意图。【具体实施方式】 下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。 本专利技术实施本文档来自技高网...

【技术保护点】
一种网络流量的数据处理方法,其特征在于,所述方法包括:从网络流量数据中获取超文本传输协议HTTP头信息和用户账户信息,所述用户账户信息包括用户的手机号码或者上网账号;从所述HTTP头信息中提取用户访问的网站的网络跟踪器cookie信息;将所述cookie信息与所述用户账户信息进行关联,并保存至用户信息数据库,其中,一个所述用户账户信息与至少一个网站的所述cookie信息相关联。

【技术特征摘要】

【专利技术属性】
技术研发人员:段起阳陈烨
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1