一种访客信息的识别方法、识别装置及可读存储介质制造方法及图纸

技术编号:22444573 阅读:20 留言:0更新日期:2019-11-02 04:29
本申请提供了一种访客信息的识别方法、识别装置及可读存储介质。在检测到用户浏览网页时,获取所述用户的唯一标识信息;基于所述唯一标识信息以及预设的多个哈希函数,确定所述唯一标识信息所对应的多个标识散列值,以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息;基于所述唯一标识信息在散列值组中的多个比特位置信息以及在所述用户浏览网页之前更新的散列值组,确定所述用户是否为新访客。由于所述唯一标识信息所对应的多个所述散列值将原本复杂的用户信息简化为数值信息,因此在查询的过程中查询的不再是复杂的用户信息,减少了搜索的信息量,加快查询的速率。

A recognition method, recognition device and readable storage medium for visitor information

【技术实现步骤摘要】
一种访客信息的识别方法、识别装置及可读存储介质
本申请涉及数据处理
,尤其是涉及一种访客信息的识别方法、识别装置及可读存储介质。
技术介绍
随着互联网技术的发展,越来越多的人会对网络中的网页进行访问,当访客对网页进行访问时,网页会先对访客的身份信息进行判断,判断其是新访客还是旧访客,然后针对新访客和旧访客,分别为新访客和旧访客推荐不同的浏览资源。目前,想要判断正在访问网页的访客是新访客还是旧访客,需要在数据库中对大量的存储在数据库中的复杂的访客信息(如访客的计算机网址等)进行搜索,因此需要搜索的信息量较大,从而导致查询速度较慢。
技术实现思路
有鉴于此,本申请的目的在于提供一种访客信息的识别方法、识别装置及可读存储介质,当检测到有用户访问网页时,获取所述用户的唯一标识信息,将所述唯一标识信息通过预设的多个哈希函数,确定所述唯一标识信息对应的多个标识散列值以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息,基于确定的所述唯一标识信息在所述散列值组中对应的比特位置信息,以及在所述用户浏览网页之前更新的散列值组,确定此时的访问用户是否为新访客。这样,本申请通过将用户的唯一标识信息通过预设的多个哈希函数计算得到多个散列值,确定所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息,并将其与在所述用户浏览网页之前更新的散列值组之间进行比较,确定所述用户是否为新访客,由于所述唯一标识信息所对应的多个所述散列值将原本复杂的用户信息简化为数值信息,因此在查询的过程中查询的不再是复杂的用户信息,减少了搜索的信息量,加快查询的速率。本申请实施例提供了一种访客信息的识别方法,所述识别方法包括:在检测到用户浏览网页时,获取所述用户的唯一标识信息;基于所述唯一标识信息以及预设的多个哈希函数,确定所述唯一标识信息所对应的多个标识散列值,以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息;基于所述唯一标识信息在散列值组中的多个比特位置信息以及在所述用户浏览网页之前更新的散列值组,确定所述用户是否为新访客。进一步的,所述基于所述唯一标识信息在散列值组中的多个比特位置信息以及在所述用户浏览网页之前更新的散列值组,确定所述用户是否为新访客,包括:检测所述唯一标识信息在散列值组中对应的每个比特位置处的数值与更新后的散列值组中在所述唯一标识信息对应的比特位置处的预设数值是否相等;若每个比特位置处的数值与每个比特位置处的预设数值相等,确定所述用户为不是新访客。进一步的,所述基于所述唯一标识信息以及预设的多个哈希函数,确定所述唯一标识信息所对应的多个标识散列值,以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息,包括:使用每个哈希函数分别计算所述唯一标识信息的标识散列值;根据每个标识散列值的数值,确定所述唯一标识信息在所述散列值组中与每个标识散列值相对应的比特位置信息。进一步的,所述识别方法通过以下方式生成所述散列值组:在每个检测子周期中,获取每一个浏览网页的访客的访客标识信息;对于每个访客,将所述访客标识信息映射至与每个检测子周期对应的子散列值组中;将包括预设个检测子周期的检测周期中的每个子散列值组中的所有子散列值进行逻辑加法运算,确定第一运算结果数据;基于所述第一运算结果数据,生成所述散列值组。进一步的,所述对于每个访客,将所述访客标识信息映射至与每个检测子周期对应的子散列值组中,包括:对于每个访客,基于所述访客的访客标识信息和预设的多个哈希函数,确定所述访客的多个标识散列值;基于每个标识散列值的数值,确定所述访客的访客标识信息在预设的子散列值组中的比特位置;对于所述访客的访客标识信息,将预设的子散列值组中与所述访客的访客标识信息对应的比特位置处的数值置为预设数值。进一步的,所述识别方法通过以下方式更新所述散列值组:按照所述检测子周期的时间次序,确定目标检测周期中第一个待删除的检测子周期所对应的子散列值组;按照所述检测子周期的时间次序,获取在所述目标检测周期后的第一个更新检测子周期中的更新子散列值组;将所述检测周期中的所有子散列值组中除第一个待删除的检测子周期所对应的子散列值组之外的其他子散列值组与所述更新子散列值组进行逻辑加法运算,确定第二运算结果数据;基于所述第二运算结果数据,确定更新后的所述散列值组。本申请实施例还提供了一种访客信息的识别装置,所述识别装置包括:第一获取模块,用于在检测到用户浏览网页时,获取所述用户的唯一标识信息;第一确定模块,用于基于所述第一获取模块获取的唯一标识信息以及预设的多个哈希函数,确定所述唯一标识信息所对应的多个标识散列值,以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息;第二确定模块,用于基于所述第一确定模块确定的唯一标识信息在散列值组中的多个比特位置信息以及在所述用户浏览网页之前更新的散列值组,确定所述用户是否为新访客。进一步的,所述第二确定模块包括:检测单元,用于检测所述第一获取模块获取的唯一标识信息在散列值组中对应的每个比特位置处的数值与更新后的散列值组中在所述唯一标识信息对应的比特位置处的预设数值是否相等;第一确定单元,用于若每个比特位置处的数值与每个比特位置处的预设数值相等,确定所述用户为不是新访客。进一步的,所述第一确定模块包括:计算单元,用于使用每个哈希函数分别计算所述唯一标识信息的标识散列值;第二确定单元,用于根据所述计算单元计算出的每个标识散列值的数值,确定所述唯一标识信息在所述散列值组中与每个标识散列值相对应的比特位置信息。进一步的,所述识别装置还包括:第二获取模块,用于在每个检测子周期中,获取每一个浏览网页的访客的访客标识信息;映射模块,用于对于每个访客,将所述第二获取模块获取到的访客标识信息映射至与每个检测子周期对应的子散列值组中;第三确定模块,用于将包括预设个检测子周期的检测周期中的每个子散列值组中的所有子散列值进行逻辑加法运算,确定第一运算结果数据;生成模块,用于基于所述第三确定模块确定的第一运算结果数据,生成所述散列值组。进一步的,所述映射模块包括:第三确定单元,用于对于每个访客,基于所述访客的访客标识信息和预设的多个哈希函数,确定所述访客的多个标识散列值;第四确定单元,用于基于每个标识散列值的数值,确定所述访客的访客标识信息在预设的子散列值组中的比特位置;映射单元,用于对于所述访客的访客标识信息,将预设的子散列值组中与所述访客的访客标识信息对应的比特位置处的数值置为预设数值。进一步的,所述识别装置通过以下方式更新所述散列值组:按照所述检测子周期的时间次序,确定目标检测周期中第一个待删除的检测子周期所对应的子散列值组;按照所述检测子周期的时间次序,获取在所述目标检测周期后的第一个更新检测子周期中的更新子散列值组;将所述检测周期中的所有子散列值组中除第一个待删除的检测子周期所对应的子散列值组之外的其他子散列值组与所述更新子散列值组进行逻辑加法运算,确定第二运算结果数据;基于所述第二运算结果数据,确定更新后的所述散列值组。本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通本文档来自技高网...

【技术保护点】
1.一种访客信息的识别方法,其特征在于,所述识别方法包括:在检测到用户浏览网页时,获取所述用户的唯一标识信息;基于所述唯一标识信息以及预设的多个哈希函数,确定所述唯一标识信息所对应的多个标识散列值,以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息;基于所述唯一标识信息在散列值组中的多个比特位置信息以及在所述用户浏览网页之前更新的散列值组,确定所述用户是否为新访客。

【技术特征摘要】
1.一种访客信息的识别方法,其特征在于,所述识别方法包括:在检测到用户浏览网页时,获取所述用户的唯一标识信息;基于所述唯一标识信息以及预设的多个哈希函数,确定所述唯一标识信息所对应的多个标识散列值,以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息;基于所述唯一标识信息在散列值组中的多个比特位置信息以及在所述用户浏览网页之前更新的散列值组,确定所述用户是否为新访客。2.根据权利要求1所述的识别方法,其特征在于,所述基于所述唯一标识信息在散列值组中的多个比特位置信息以及在所述用户浏览网页之前更新的散列值组,确定所述用户是否为新访客,包括:检测所述唯一标识信息在散列值组中对应的每个比特位置处的数值与更新后的散列值组中在所述唯一标识信息对应的比特位置处的预设数值是否相等;若每个比特位置处的数值与每个比特位置处的预设数值相等,确定所述用户不是新访客。3.根据权利要求1所述的识别方法,其特征在于,所述基于所述唯一标识信息以及预设的多个哈希函数,确定所述唯一标识信息所对应的多个标识散列值,以及所述唯一标识信息在散列值组中与每个标识散列值相对应的比特位置信息,包括:使用每个哈希函数分别计算所述唯一标识信息的标识散列值;根据每个标识散列值的数值,确定所述唯一标识信息在所述散列值组中与每个标识散列值相对应的比特位置信息。4.根据权利要求1所述的识别方法,其特征在于,通过以下方式生成所述散列值组:在每个检测子周期中,获取每一个浏览网页的访客的访客标识信息;对于每个访客,将所述访客标识信息映射至与每个检测子周期对应的子散列值组中;将包括预设个检测子周期的检测周期中的每个子散列值组中的所有子散列值进行逻辑加法运算,确定第一运算结果数据;基于所述第一运算结果数据,生成所述散列值组。5.根据权利要求4所述的识别方法,其特征在于,所述对于每个访客,将所述访客标识信息映射至与每个检测子周期对应的子散列值组中,包括:对于每个访客,基于所述访客的访客标识信息和预设的多个哈希函数,确定所述访客的多个标识散列值;基于每个标识散列值的数值,确定所述访客的访客标识信息在预设的子散列值组中的比特位置;对于所...

【专利技术属性】
技术研发人员:黄安
申请(专利权)人:秒针信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1