一种Cookie标识关联方法及装置制造方法及图纸

技术编号:13110552 阅读:81 留言:0更新日期:2016-03-31 15:50
一种Cookie标识关联方法及装置,所述方法包括:基于上网行为数据确定候选Cookie标识组;所述上网行为数据包括:Cookie标识、网络行为信息以及时间戳;生成所述候选Cookie标识组的特征信息;所述特征信息表征所述候选Cookie标识组中Cookie标识的关联程度;参照分类模型,在所述候选Cookie标识组中选取目标Cookie标识组;所述分类模型包括:正确关联的Cookie标识组样本和错误关联的Cookie标识组样本;所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本均包括所述特征信息;记录所述目标Cookie标识组的关联关系,以关联对应的Cookie。所述方法及装置可以在对应同一用户的Cookie之间建立准确度较高的关联关系。

【技术实现步骤摘要】

本专利技术设及互联网领域,尤其设及一种Cookie标识关联方法及装置
技术介绍
在互联网上用户行为定向应用中,最核屯、的技术就是对访客进行标记。目前常用 的标记方法是用Js Cookie。当用户再次访问网站时,网站可W通过Cookie中存储的信息对 用户进行标定和识别。 但是,有时对应于同一用户的Cookie会W几个文件的形式保存,导致基于Cookie 的用户行为分析不够准确,故需要在对应同一用户的Cookie之间建立准确度较高关联关 系。
技术实现思路
本专利技术解决的技术问题是在对应同一用户的Cookie之间建立准确度较高的关联 关系。 为解决上述技术问题,本专利技术实施例提供一种Cookie标识关联方法,包括: 基于上网行为数据确定候选Cookie标识组;所述上网行为数据包括:Cookie标识、 网络行为信息W及时间戳; 生成所述候选Cookie标识组的特征信息;所述特征信息表征所述候选Cookie标识 组中Cooki e标识的关联程度;[000引参照分类模型,在所述候选Cookie标识组中选取目标Cookie标识组;所述分类模 型包括:正确关联的Cookie标识组样本和错误关联的Cookie标识组样本;所述正确关联的 Cookie标识组样本和错误关联的Cookie标识组样本均包括所述特征信息; 记录所述目标Cookie标识组的关联关系,W关联对应的Cookie。 可选的,所述的Cookie标识关联方法还包括:对所述上网行为数据进行标准化处 理,W统一所述上网行为数据的格式。 可选的,所述网络行为信息包括网络识别标识,所述确定候选Cookie标识组包括: 在对应于同一网络识别标识的Cooki e标识中选取候选Cooki e标识组。 可选的,所述确定候选Cookie标识组还包括:确定所述对应于同一网络识别标识 的Cookie标识的数目小于阔值。 可选的,所述生成所述候选Cookie标识组的特征信息包括生成W下至少一种:用 户识别标识信息、相同网站浏览信息、网站相似度信息、网络行为时间信息;其中: 生成所述用户识别标识信息包括:获取所述Cookie标识组中每个Cookie标识分别 对应的用户识别标识;判断所述每个Cookie标识分别对应的用户识别标识中是否包含同样 的用户识别标识;基于所述判断结果确定所述用户识别标识信息的特征数值; 生成所述相同网站浏览信息包括:计算所述Cookie标识组中的各Cookie标识与相 同网站间具有对应关系的概率;生成所述相同网站浏览信息的特征数值; 生成所述浏览网站相似度信息包括:对与所述Cookie标识组中的各Cookie标识建 立过对应关系的网站进行类型相似度计算;生成所述浏览网站相似度信息的特征数值; 生成所述网络行为时间信息包括:计算所述Cooki e标识组中Cooki e标识对应的网 络行为出现在同一时间段内的次数和频率;生成所述网络行为事件信息的特征数值。 可选的,所述正确关联的Cookie标识组样本通过如下方式生成: 选取对应于同一用户的第一 Cookie标识; 改变所述第一 Cookie标识为第二Cookie标识; 所述第一 Cookie标识和所述第二Cookie标识组成的Cookie标识组作为正确关联 的Cookie标识组; 参照所述第一 Cookie标识对应的上网行为数据和所述第二Cookie标识对应的上 网行为数据,生成所述正确关联的Cookie标识组的特征信息; 所述正确关联的Cookie标识组样本包括所述正确关联的Cookie标识组的特征信 息和所述正确关联的标识值。 可选的,所述错误关联的Cookie标识组样本通过如下方式生成: 选取对应于不同用户的第^Cookie标识和第四Cookie标识; 所述第SCookie标识和所述第四Cookie标识组成的Cookie标识组作为错误关联 的Cookie标识组; 参照所述第SCookie标识对应的上网行为数据和所述第四Cookie标识对应的上 网行为数据,生成作所述错误关联的Cookie标识组的特征信息;所述错误关联的Cookie标识组样本包括所述错误关联的Cookie标识组的特征信 息和所述错误关联的标识值。可选的,所述参照分类模型,在所述候选Cookie标识组中选取目标Cookie标识组 包括: 参照所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本,分别计 算对应所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本中包含的各个 特征信息的权重值; 参照所述各个特征信息的权重值和所述候选Cookie标识组的特征信息,构造预测 函数; 参照所述预测函数的函数值,在所述候选Cooki e标识组中选取目标Cooki e标识 组。 本专利技术实施例还提供一种Cookie标识关联装置,包括:候选Cookie标识组选取单 元、特征信息生成单元、目标Cookie标识组确定单元W及关联单元; 所述候选Cookie标识组选取单元,适于基于上网行为数据确定候选Cookie标识 组;所述上网行为数据包括:Cookie标识、网络行为信息W及时间戳; 所述特征信息生成单元,适于生成所述候选Cookie标识组的特征信息;所述特征 信息表征所述候选Cooki e标识组中Cooki e标识的关联程度; 所述目标Cookie标识组确定单元,适于参照分类模型,在所述候选Cookie标识组 中选取目标Cookie标识组;所述分类模型包括:正确关联的Cookie标识组样本和错误关联 的Cookie标识组样本;所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本 均包括所述特征信息; 所述关联单元,适于记录所述目标Cookie标识组的关联关系,W关联对应的 Cookie。 可选的,所述的Cookie标识关联装置还包括:标准化处理单元,适于对所述上网行 为数据进行标准化处理,W统一所述上网行为数据的格式。 可选的,所述网络行为信息包括网络识别标识,所述确定候选Cookie标识组包括: 在对应于同一网络识别标识的Cooki e标识中选取候选Cooki e标识组。 可选的,所述的Cookie标识关联装置还包括:数目判断单元,适于确定所述对应于 同一网络识别标识的Cookie标识的数目小于阔值。 可选的,所述特征信息生成单元,适于生成W下至少一种Cookie标识组的特征信 息:用户识别标识信息、相同网站浏览信息、网站相似度信息、网络行为时间信息;其中: 生成所述用户识别标识信息包括:获取所述Cookie标识组中每个Cookie标识分别 对应的用户识别标识;判断所述每个Cookie标识分别对应的用户识别标识中是否包含同样 的用户识别标识;基于所述判断结果确定所述用户识别标识信息的特征数值; 生成所述相同网站浏览信息包括:计算所述Cookie标识组中的各Cookie标识与相 同网站间具有对应关系的概率;生成所述相同网站浏览信息的特征数值; 生成所述浏览网站相似度信息包括:对与所述Cookie标识组中的各Cookie标识建 立过对应关系的网站进行类型相似度计算;生成所述浏览网站相似度信息的特征数值; 生成所述网络行为时间信息包括:计算所述Cookie标识组中的各Cookie标识对本文档来自技高网...

【技术保护点】
一种Cookie标识关联方法,其特征在于,包括:基于上网行为数据确定候选Cookie标识组;所述上网行为数据包括:Cookie标识、网络行为信息以及时间戳;生成所述候选Cookie标识组的特征信息;所述特征信息表征所述候选Cookie标识组中Cookie标识的关联程度;参照分类模型,在所述候选Cookie标识组中选取目标Cookie标识组;所述分类模型包括:正确关联的Cookie标识组样本和错误关联的Cookie标识组样本;所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本均包括所述特征信息;记录所述目标Cookie标识组的关联关系,以关联对应的Cookie。

【技术特征摘要】

【专利技术属性】
技术研发人员:汤奇峰叶峰
申请(专利权)人:上海晶赞科技发展有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1