【技术实现步骤摘要】
一种ID关联方法和装置
本专利技术涉及互联网
,特别是涉及一种ID关联方法和装置。
技术介绍
由于网络共享检测等技术需要一种能够唯一标识设备的ID,使用这种ID就能够匹配出一个IP用户的流量是由几个设备发出的。通过将某IP发出的流量与唯一标识设备的ID进行匹配,如果匹配出N个不同值,则能够检测出这个IP的流量是由N个设备组成的。传统的设备ID检测方法对于ID项是独立处理的,无法进行关联。例如一个IP用户的流量里面使用MAC地址这个ID检测到了5个不同值,表明这个IP流量是由5个不同设备组成。又使用手机号这个ID检测到了3个不同值,表明这个IP流量是由3个不同设备组成。那么这个IP地址流量里面5个不同MAC地址的设备和3个不同手机号的设备之间是什么关系,无法判断,可能3个不同手机号的设备就在那5个不同MAC设备里面,但是也可能是另外的3个设备,例如5台PC和3台手机,由于缺少判断条件,因此最终只能取最大值,表示这个IP的流量最多是由5个设备组成。鉴于此,克服该现有技术所存在的缺陷是本
亟待解决的问题 ...
【技术保护点】
1.一种ID关联方法,其特征在于,设定对应IP相同情况的标识为I、对应IP不同情况的标识为i、对应Host-Key相同且Host-Key的value值相同情况的标识为V、对应Host-Key相同且Host-Key的value值不同情况的标识为v,方法包括:/n将对应IP相同且Host-Key相同且Host-Key的value值相同情况的标识设定为IV;将对应IP相同且Host-Key相同且Host-Key的value值不同情况的标识设定为Iv;将对应IP不同且Host-Key相同且Host-Key的value值相同情况的标识设定为iV;将对应IP不同且Host-Key相同且 ...
【技术特征摘要】
1.一种ID关联方法,其特征在于,设定对应IP相同情况的标识为I、对应IP不同情况的标识为i、对应Host-Key相同且Host-Key的value值相同情况的标识为V、对应Host-Key相同且Host-Key的value值不同情况的标识为v,方法包括:
将对应IP相同且Host-Key相同且Host-Key的value值相同情况的标识设定为IV;将对应IP相同且Host-Key相同且Host-Key的value值不同情况的标识设定为Iv;将对应IP不同且Host-Key相同且Host-Key的value值相同情况的标识设定为iV;将对应IP不同且Host-Key相同且Host-Key的value值不同情况的标识设定为iv;
依据IV和iv的参数值越大越优、Iv和iV的参数值越小越优的对应关系,根据对应每一组Host-Key统计的IV、iv、Iv和iV,计算每一组Host-Key的得分;
根据每一组Host-Key的得分,动态的筛选出当前数据分析场景中的多个用于标识待分析对象的ID;
根据筛选出的多个待分析对象的ID,进行流量的遍历,对于同一流量中包含有至少两个待分析对象的ID的,建立相应至少两个待分析对象的ID的关联关系。
2.根据权利要求1所述的ID关联方法,其特征在于,在分析流量数据时,方法还包括:
对于两条流量数据中,若各自包含的ID之间建立有关联关系,并且,两条流量数据中没有所述建立有关联关系ID之外的其它ID;则将所述两条流量数据作为关联流量数据;
其中,在进行所述建立有关联关系ID中任一对象的分析过程中,所述两条流量数据均作为被分析流量数据存在。
3.根据权利要求1所述的ID关联方法,其特征在于,所述根据对应每一组Host-Key统计的IV、iv、Iv和iV,计算每一组Host-Key的得分,具体包括:
根据公式Score=(IV*iv)/(Iv*iV)来计算每一组Host-key的得分;或者,
根据公式Score=(IV-Iv)*(iv-iV)来计算每一组Host-key的得分;或者,
根据公式Score=(IV+iv)/(IV+iv+Iv+iV)*100来计算每一组Host-key的得分。
4.根据权利要求3所述的ID关联方法,其特征在于,所述根据每一组Host-Key的得分,动态的筛选出当前数据分析场景中的多个ID,具体包括:
取Host-Key计算得分位于预设第一排名值之前的Host-Key作为当前数据分析场景动态生成的ID;其...
【专利技术属性】
技术研发人员:白司特,雷葆华,谭国权,李明栋,
申请(专利权)人:武汉绿色网络信息服务有限责任公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。