一种ID发现方法和装置制造方法及图纸

技术编号：23898453 阅读：33 留言：0更新日期：2020-04-22 09:40

本发明专利技术涉及互联网技术领域，提供了一种ID发现方法和装置。其中方法包括将对应IP相同且Host‑Key相同且Host‑Key的value值相同情况的标识设定为IV；将对应IP相同且Host‑Key相同且Host‑Key的value值不同情况的标识设定为Iv；将对应IP不同且Host‑Key相同且Host‑Key的value值相同情况的标识设定为iV；将对应IP不同且Host‑Key相同且Host‑Key的value值不同情况的标识设定为iv；给每一组Host‑Key计算得分，从而动态的筛选出当前数据分析场景中的ID。本发明专利技术对ID的发现是通过现场数据学习到的，而非预先设置好的，具有现场自适应性。

全部详细技术资料下载

【技术实现步骤摘要】
一种ID发现方法和装置
本专利技术涉及互联网
，特别是涉及一种ID发现方法和装置。
技术介绍
由于网络共享检测等技术应用和普及，急需要一种能够唯一标识设备的ID，使用这种ID就能够匹配出一个IP用户的流量是由几个设备发出的。通过将某IP发出的流量与唯一标识设备的ID进行匹配，如果匹配出N个不同值，则能够检测出这个IP的流量是由N个设备组成的。现有的ID标识技术是从已知的认知当中枚举出唯一标识设备的ID，例如设备IP、MAC地址、手机号、用户名、应用ID、IMEI号等，这样做的问题有：问题一、对于实际现场情况可能存在不匹配情况，因为实际现场的信息因地而异，一个统一提前预置的唯一标识设备的ID，可能对于某些场景并不适用，甚至不存在。例如：明文的手机号、明文的用户账号等ID信息由于隐私保护的需要，可能会在待检测数据中被抹去。但会以其他加密或者信息组合的方式出现。又或者在某些地区，例如一二线城市和三四线城市，由于用户的应用使用有区别，导致某些在一二线城市高频的应用，在三四线城市却是低频的。问题二、预置的唯一标识设备ID数量有限。因为提前预置的唯一标识设备的ID，是综合所有场景，找到用户群使用最多的那些能代表身份的信息，并且这些信息是需要逐个通过具体分析每个协议来提取出ID的标示方法。现有技术思路是：寻找那些能作为唯一标识设备的ID，因此由于人力工作量，以及预先假想到的ID数量，限制了所能达到的ID数量。鉴于此，克服该现有技术所存在的缺陷是本
亟待解决的问题。【专利技...

【技术保护点】
1.一种ID发现方法，其特征在于，设定对应IP相同情况的标识为I、对应IP不同情况的标识为i、对应Host-Key相同且Host-Key的value值相同情况的标识为V、对应Host-Key相同且Host-Key的value值不同情况的标识为v，方法包括：/n将对应IP相同且Host-Key相同且Host-Key的value值相同情况的标识设定为IV；将对应IP相同且Host-Key相同且Host-Key的value值不同情况的标识设定为Iv；将对应IP不同且Host-Key相同且Host-Key的value值相同情况的标识设定为iV；将对应IP不同且Host-Key相同且Host-Key的value值不同情况的标识设定为iv；/n依据IV和iv的参数值越大越优、Iv和iV的参数值越小越优的对应关系，根据对应每一组Host-Key统计的IV、iv、Iv和iV，计算每一组Host-Key的得分；/n根据每一组Host-Key的得分，动态的筛选出当前数据分析场景中的ID。/n

【技术特征摘要】
1.一种ID发现方法，其特征在于，设定对应IP相同情况的标识为I、对应IP不同情况的标识为i、对应Host-Key相同且Host-Key的value值相同情况的标识为V、对应Host-Key相同且Host-Key的value值不同情况的标识为v，方法包括：
将对应IP相同且Host-Key相同且Host-Key的value值相同情况的标识设定为IV；将对应IP相同且Host-Key相同且Host-Key的value值不同情况的标识设定为Iv；将对应IP不同且Host-Key相同且Host-Key的value值相同情况的标识设定为iV；将对应IP不同且Host-Key相同且Host-Key的value值不同情况的标识设定为iv；
依据IV和iv的参数值越大越优、Iv和iV的参数值越小越优的对应关系，根据对应每一组Host-Key统计的IV、iv、Iv和iV，计算每一组Host-Key的得分；
根据每一组Host-Key的得分，动态的筛选出当前数据分析场景中的ID。

2.根据权利要求1所述的ID发现方法，其特征在于，所述根据对应每一组Host-Key统计的IV、iv、Iv和iV，计算每一组Host-Key的得分，具体包括：
根据公式Score＝(IV*iv)/(Iv*iV)来计算每一组Host-key的得分；或者，
根据公式Score＝(IV-Iv)*(iv-iV)来计算每一组Host-key的得分；或者，
根据公式Score＝(IV+iv)/(IV+iv+Iv+iV)*100来计算每一组Host-key的得分。

3.根据权利要求2所述的ID发现方法，其特征在于，所述根据每一组Host-Key的得分，动态的筛选出当前数据分析场景中的ID，具体包括：
取Host-Key计算得分位于预设第一排名值之前的Host-Key作为当前数据分析场景动态生成的ID。

4.根据权利要求3所述的ID发现方法，其特征在于，所述预设第一排名值为200-500或者排名位于总的前10％作为所述预设第一排名值。

5.根据权利要求2所述的ID发现方法，其特征在于，所述根据每一组Host-Key的得分，动态的筛选出当前数据分析场景中的ID中，具...

【专利技术属性】
技术研发人员：白司特，雷葆华，谭国权，
申请(专利权)人：武汉绿色网络信息服务有限责任公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人