一种基于浏览器的高性能用户追踪方法技术

技术编号:15301768 阅读:61 留言:0更新日期:2017-05-13 08:17
本发明专利技术公开一种基于浏览器的高性能用户追踪方法,包括:步骤1、获取用户浏览器特征信息,生成相应的Fingerprint指纹值,并将所述用户浏览器特征信息以及相应的Fingerprint指纹值发送到相应的后台服务器;步骤S2、根据所述用户浏览器特征信息以及相应的Fingerprint指纹值,依据策略性指纹识别方法对得到的相应数据进行关联处理;步骤S3、将关联后的用户客户端信息存储到Redis数据库,使用过滤识别方式对新的指纹数据进行处理,判定两个指纹信息是否相关联。采用本发明专利技术的技术方案,可以高效且方便地追踪用户。

A browser based high-performance user tracking method

The invention discloses a tracing method based on high performance user browser: Step 1, access to information users browser features, generate Fingerprint fingerprint values corresponding to the user's browser, and Fingerprint fingerprint feature information and the corresponding value is sent to the corresponding backend server; step S2, according to the user's browser and feature information Fingerprint fingerprint of the corresponding value, the corresponding data were obtained according to the method of correlation strategy of fingerprint identification; step S3, the association after the client information stored in the Redis database, using the filtering processing of fingerprint identification of new data, to determine whether the two fingerprint information associated. By adopting the technical proposal of the invention, users can be tracked efficiently and conveniently.

【技术实现步骤摘要】

本专利技术属于信息收集
,尤其涉及一种基于浏览器的高性能用户追踪方法
技术介绍
随着用户隐私安全意识越来越高,以及Cookie暴漏的安全问题也随之增长,用户通过安装插件或者禁用Cookie等方法来保护个人隐私。Canvas指纹技术是虽然能有效的追踪一个用户,由于Canvas渲染技术是基于用户的硬件设备,所以该技术有一个很高的碰撞率。对于一些恶意攻击者,通过VPS或者其他加密代理的方式来隐藏自己的信息,使得追踪和识别变得更加困难。传统的分析日志的方式只能对攻击事件进行分析,并不能有效的追踪恶意攻击者,用户的追踪和识别依旧非常艰难。EFF提出的BrowserFingerprint指纹识别技术能够有效且唯一地识别用户的浏览器特征信息,但是在追踪用户方便并不高效。
技术实现思路
本专利技术要解决的技术问题是,提供一种基于浏览器的高性能用户追踪方法。为解决上述问题,本专利技术采用如下的技术方案:一种基于浏览器的高性能用户追踪方法包括以下步骤:步骤1、获取用户浏览器特征信息,生成相应的Fingerprint指纹值,并将所述用户浏览器特征信息以及相应的Fingerprint指纹值发送到相应的后台服务器;步骤S2、根据所述用户浏览器特征信息以及相应的Fingerprint指纹值,依据策略性指纹识别方法对得到的相应数据进行关联处理;步骤S3、将关联后的用户客户端信息存储到Redis数据库,使用过滤识别方式对新的指纹数据进行处理,判定两个指纹信息是否相关联。作为优选,用户浏览器特征的信息包括浏览器本身的特征信息以及浏览器所在终端的信息;浏览器本身的特征信息包括:浏览器UA、语言Language、使用字体Font、安装插件Plugins、Cookie和Canvas信息、浏览器所属的平台Platform、HTML5的本地存储机制Local_stroage和Session_stroage、是否允许追踪DoNotTrack等;浏览器所在终端的信息包括:公网和内网IP;色彩深度Color_depth;时区Time_zone;屏幕分辨率Resolution等。作为优选,步骤S2中通过fingerprint值、cookie和canvas、内网IP和外网IP三组唯一标识用户的方式来对指纹信息进行关联性的比对判断。作为优选,步骤S3中,当出现新的指纹信息,先将其与redis数据库中已被识别的指纹进行比对,若存在则可直接存入相应的数据库,若不存在则重新与所有指纹进行策略性识别关联比对。作为优选,如果不能通过fingerprint值、cookie和canvas、内网IP和外网IP三组唯一标识用户的方式来对指纹信息进行关联性的比对判断,则需要对剩余的特征信息进行进一步的判别分析,具体为:对于特征信息值长度较短的直接进行字符串比对;使用Difflib库对特征信息值长度较长的进行字符串相似比较,通过Difflib库的ratio()函数求得特征信息值的相似度值,若该相似度值在特征对应的阈值范围内,则认为特征信息相同;结合计算比较的结果与对应权重值相乘,可得出两条指纹最终的指纹相似度值;将所述指纹相似度值与浏览器指纹的相似度阈值进行比对,在阈值范围内的指纹相似度值则表明其所代表的两条指纹来自于同一浏览器。作为优选,利用德尔菲方法给每个浏览器特征信息设定权重,得出最终的权重值。本专利技术为了实现有效追踪用户,收集用户浏览器特征的信息,并在大批量的用户浏览器特征信息中高效地识别出因浏览器特征信息改变生成的不同的Fingerprint值,同时采用策略性的识别方法,依托于一个搭建在公网服务器上的一个站点,主要负责收集用户的浏览器特征信息,对不同阶段的有改变的指纹进行有效的关联和识别,以实现高性能用户追踪。本专利技术用户追踪方法,通过网站收集中用户的浏览器特征信息,并发送至网站后台;使用策略性识别算法对收集到的数据进行关联分析,本专利技术的策略性识别算法使用德尔菲方法给每个浏览器特征设定权重;在特征信息的比对中,对特征信息值较短的字符串进行直接比对,通过Difflib对较长的特征信息值字符串进行相似性比对,针对同一浏览器在比较的特征信息值上可能有的范围内的变化进行定性测试,以此求得每一项对应的阈值,通过Difflib库的ratio()函数求得特征信息值的相似度值,若该相似度值在特征对应的阈值范围内,则认为特征信息相同;结合计算比较的结果与对应权重值相乘,可得出两条指纹最终的指纹相似度值;最后针对所有的浏览器特征信息项,界定两个以下(包含两个)的特征信息值不一致为同一浏览器指纹,并对所有的浏览器信息值进行定性的升级或伪造测试,对所有测得的指纹相似度值求平均值,设定为整个浏览器指纹的相似度阈值;将上一步求得的指纹相似度值与得到的相似度阈值进行比对,在阈值范围内的指纹相似度值则表明其所代表的两条指纹来自于同一浏览器;当收集到新的指纹时,通过在已识别出的指纹中进行过滤识别,若没有匹配,则继续使用策略性识别算法与所有的指纹进行相似关联分析。本专利技术能够实现高效地判定两个指纹信息是否相关联。附图说明图1是本专利技术实施方式中基于德尔菲方法计算权重的结果示意图;图2是本专利技术实施方式中的一些浏览器特征项信息的展示示意图;图3是本专利技术实施方式中策略性识别算法中的核心比对算法;图4是本专利技术实施方式中用户追踪的框架示意图。具体实施方式以下将结合附图所示的具体实施方式对本专利技术作进一步详细说明。本专利技术实施例提供一种基于浏览器的高性能用户追踪方法,包括以下步骤:步骤1、获取用户浏览器特征信息,生成相应的Fingerprint指纹值,并将所述用户浏览器特征信息以及相应的Fingerprint指纹值发送到相应的后台服务器;步骤S2、根据所述用户浏览器特征信息以及相应的Fingerprint指纹值,依据策略性指纹识别方法对得到的相应数据进行关联处理;步骤S3、将关联后的用户客户端信息存储到Redis数据库,使用过滤识别方式对新的指纹数据进行处理,判定两个指纹信息是否相关联。步骤1具体为:采用JavaScript语言技术获取用户浏览器的特征信息。用户浏览器特征的信息包括浏览器本身的特征信息以及浏览器所在终端的信息;浏览器本身的特征信息包括:浏览器UA、语言Language、使用字体Font、安装插件Plugins、Cookie和Canvas信息、浏览器所属的平台Platform、HTML5的本地存储机制Local_stroage和Session_stroage、是否允许追踪DoNotTrack等;浏览器所在终端的信息包括:公网和内网IP;色彩深度Color_depth;时区Time_zone;屏幕分辨率Resolution等。关于浏览器特征信息的收集功能都被写在Fingerprint.js脚本中。通过在VPS上搭建测试网站,将信息收集功能脚本加载到网站上。当用户浏览该网站的时候,JavaScript脚本对浏览器特征信息进行收集,使用murmurhash算法对特征信息进行哈希生成一个指纹值,即浏览器指纹。网站前端将所有信息回传到后台服务器,并存入数据库。步骤2具体为:在后台服务器对接收到的所有用户浏览器指纹信息进行关联分析,整个关联处理包括:利用德尔菲法设定权重因浏览器的不同特征对指纹处理造成的影响不一,因此本文档来自技高网...
一种基于浏览器的高性能用户追踪方法

【技术保护点】
一种基于浏览器的高性能用户追踪方法,其特征在于,包括以下步骤:步骤1、获取用户浏览器特征信息,生成相应的Fingerprint指纹值,并将所述用户浏览器特征信息以及相应的Fingerprint指纹值发送到相应的后台服务器;步骤S2、根据所述用户浏览器特征信息以及相应的Fingerprint指纹值,依据策略性指纹识别方法对得到的相应数据进行关联处理;步骤S3、将关联后的用户客户端信息存储到Redis数据库,使用过滤识别方式对新的指纹数据进行处理,判定两个指纹信息是否相关联。

【技术特征摘要】
1.一种基于浏览器的高性能用户追踪方法,其特征在于,包括以下步骤:步骤1、获取用户浏览器特征信息,生成相应的Fingerprint指纹值,并将所述用户浏览器特征信息以及相应的Fingerprint指纹值发送到相应的后台服务器;步骤S2、根据所述用户浏览器特征信息以及相应的Fingerprint指纹值,依据策略性指纹识别方法对得到的相应数据进行关联处理;步骤S3、将关联后的用户客户端信息存储到Redis数据库,使用过滤识别方式对新的指纹数据进行处理,判定两个指纹信息是否相关联。2.如权利要求1所述的基于浏览器的高性能用户追踪方法,其特征在于,用户浏览器特征的信息包括浏览器本身的特征信息以及浏览器所在终端的信息;浏览器本身的特征信息包括:浏览器UA、语言Language、使用字体Font、安装插件Plugins、Cookie和Canvas信息、浏览器所属的平台Platform、HTML5的本地存储机制Local_stroage和Session_stroage、是否允许追踪DoNotTrack等;浏览器所在终端的信息包括:公网和内网IP;色彩深度Color_depth;时区Time_zone;屏幕分辨率Resolution等。3.如权利要求1所述的基于浏览器的高性能用户追踪方法,其特征在于,步骤S2中通过fingerprint...

【专利技术属性】
技术研发人员:姜伟王晓茜庄俊玺吴贤达田原潘邵芹
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1