一种用户设备指纹的提取和识别方法及系统技术方案

技术编号:13791622 阅读:1137 留言:0更新日期:2016-10-06 01:25
本发明专利技术公开了一种用户设备指纹的提取和识别方法及系统,采用了收集设备CPU时钟偏移的方式,实现对当前设备的识别,与现有技术相比,用户不再必须安装插件,简化了操作流程,也避免了控件可能失效的风险提高了稳定性;设备的时钟偏移几乎无法修改,所以相对于传统的依据mac地址等硬件信息的方式准确度更高。同时本发明专利技术方法在不需要安装控件的情况下实现设备的识别,提高了用户体验。经过长时间大量的模拟测试,分析设备的历史数据,通过观察同一设备的历史ip地址的变化情况,计算出精确度在99%左右。

【技术实现步骤摘要】

本专利技术属于互联网领域,涉及一种设备指纹的提取和识别方法及系统。
技术介绍
随着互联网业务的发展,对于用户身份的识别有越来越高的要求,传统方式依靠用户名密码,这种方式的弊端就是密码容易泄露,密码过于简单甚至可以通过暴力破解的方式进行破解,在这个背景下,考虑对用户使用的设备进行识别。现在的技术基本通过安装控件的方式提取机器的MAC地址,CPU的编号,硬盘编号等一些硬件设备的信息作为机器的指纹,这种方式的准确率很高但是缺点也很明显,需要用户安装控件,用户体验感差,同时控件容易与其他安装的应用程序发生冲突导致浏览器出现异常,有些第三方杀毒软件会将控件识别为病毒提示用户卸载,所以通过控件方式识别设备同时存在稳定性问题。
技术实现思路
技术问题:本专利技术提供一种在用户无感知的情况下通过获取机器属性对设备进行识别,无需用户安装控件、提高了用户体验的用户设备指纹的提取和识别方法及系统。技术方案:本专利技术的用户设备指纹的提取和识别方法,包括以下步骤:1)通过设置在页面中的脚本收集访问该页面的用户设备系统信息;2)解析用户设备系统信息,获取该用户设备的系统时间,并计算系统时间与世界标准时间的时钟偏移速度;3)根据所述时钟偏移速度和用户设备系统信息计算该用户设备的simhash值,并用该simhash值作为设备识别指纹。本专利技术方法的优选方案中,还包括:计算该用户设备的simhash值与存储的各用户设备simhash值之间的海明距离;如果有一个海明距离小于判定阈值,则判定该用户设备与对应的存储的用户设备为同一设备,否则判定该用户设备为新设备,并存储该用户设备的simhash值。本专利技术方法的优选方案中,用户设备系统信息包括系统版本、浏览器的版本、浏览器语言、浏览器插件信息。本专利技术方法的优选方案中,用户设备系统信息还包括以下一种或其任一组合:用户代理信息、浏览器生产商和时区。本专利技术方法的优选方案中,用户设备系统信息还包括以下任一种或两种的组合:使用浏览器窗口对象的屏幕子对象收集的当前屏幕的显示窗口信息,所述显示窗口信息至少包括屏幕分辨率和颜色深度;使用flash脚本收集的当前系统的flash版本信息、系统字符集、音频信息和系统语言。本专利技术方法的优选方案中,还包括:解析浏览器客户端的ip地址,获取省市区、经纬度,并将其应用到计算该用户设备的simhash值中。本专利技术方法的优选方案中,simhash值根据该用户设备的时钟偏移速度和用户设备系统信息,及设定的各参数权重,采用simhash算法计算得到。本专利技术的用户设备指纹的提取和识别系统,包括:设备信息采集单元,用以通过设置在页面中的脚本收集设备系统信息收集访问该页面的用户设备系统信息;系统时间获取单元,用以解析用户设备系统信息,获取用户设备的系统时间;时钟偏移速度计算单元,用以计算用户设备系统时间与世界标准时间的时钟偏移速度;Simhash算法单元,用以根据所述时钟偏移速度和用户设备系统信息计算该用户设备的simhash值,并用该simhash值作为设备识别指纹。本专利技术系统的优选方案中,还包括:数据库,用以存储用户设备的simhash值;海明距离计算单元,用以计算本次采集用户设备的simhash值与存储的各用户设备simhash值之间的海明距离,设备指纹识别单元,如果海明距离计算单元获得的海明距离中,有一个小于判定阈值,则判定该设备与对应的存储的设备为同一设备,否则判定该设备为新设备,并将其simhash值和设备信息存到数据库中。本专利技术系统的优选方案中,还包括地理位置信息获取单元,用以解析浏览器客户端的ip地址,获取省市区、经纬度。有益效果:本专利技术与现有技术相比,具有以下优点:本专利技术所使用的方法,采用了收集设备CPU时钟偏移的方式,实现对当前设备的识别,与现有技术相比,用户不再必须安装插件,简化了操作流程,也避免了控件可能失效的风险提高了稳定性;设备的时钟偏移几乎无法修改,所以相对于传统的依据mac地址等硬件信息的方式准确度更高。同时本专利技术方法在不需要安装控件的情况下实现设备的识别,提高了用户体验。经过长时间大量的模拟测试,分析设备的历史数据,通过观察同一设备的历史ip地址的变化情况,计算出精确度在99%左右。附图说明图1是本专利技术实施例的方法流程图。图2是本专利技术另一实施例的系统结构图。具体实施方式下面结合实施例和说明书附图对本专利技术作进一步的说明。本专利技术实施例的方法流程,请参阅图1所示,在运行设备指纹提取方法前,需要先在注册或登录页面等交互页面嵌入脚本,在页面被打开时执行脚本开始收集设备系统信息,计算用户设备的系统时间与世界标准时间的时钟偏移速度,根据时钟偏移速度和用户设备系统信息计算该用户设备的simhash值,并用该simhash值作为设备识别指纹,具体内容如下:1)使用浏览器窗口对象收集当前设备的系统版本、浏览器的版本、浏览器语言和浏览器插件信息,其中的浏览器窗口对象(window)是脚本(JS)中最大的对象,它描述的是一个浏览器窗口,通过这个窗口可以获得许多浏览器属性。2)后台服务端根据接收到的客户端发送请求解析TCP报文(浏览器客户端发送请求到服务端使用HTTP协议,此协议是基于TCP连接的,因此可以获得传输的TCP报文信息),从解析得到的TCP报文的头信息中获取浏览器客户端所在的设备系统内部时间,然后计算系统时钟偏移速度,即系统内部时间与世界标准时间的偏移速度。具体计算方法为:以世界标准时间为横坐标,单位为10毫秒,系统内部时间减去标准时间为纵坐标,单位为微秒,通过计算相邻两点所连直线的导数,得出所有导数的值,接着取所有导数的平均值,该平均值即为偏移速度。由于每个设备的系统内部时钟通过CPU计数器进行累加得到,是设备内部时钟计数器记录的时间,在记录时间时会因为温度,内部接线的长度、地理位置等因素的影响而产生偏移,使得这个时间与世界标准时间存在差异。研究表明,不同两台设备的系统时钟偏移速度很少是相同的,并且对于同一台设备,其时钟偏移速度在温度等外界环境比较稳定的情况下是比较稳定的,因此本专利技术将该偏移速度作为表征和识别设备的一个重要指标。3)根据时钟偏移速度和选择的相关设备信息,采用simhash算法计算设备的simhash值。设备的时钟偏移并非所有设备都是不一样的,有可能出现两个设备类似的情况,因为偏移量是会受温度影响的,所以不能单纯靠时钟偏移来判断是否同一设备。因此本专利技术根据时钟偏移速度和相关设备信息,按照设定的各参数的权重,采用simhash算法获取设备的simhash值,并将其作为设备识别指纹,具有更好的准确度。simhash算法是一种计算文本相似度的算法,相似度越高的两段文本,simhash值的海明距离越小。本专利技术方法的一种优选方案中,在得到上述用户设备的simhash值后,进一步包括用户设备指纹的识别。即计算该设备simhash值与数据库中所有已存储的设备simhash值的海明距离,获得的海明距离即为该设备时钟偏移速度和用户设备系统信息与已存储设备的时钟偏移速度和用户设备系统信息之间的文本相似度(simhash相似度)。若数据库中存在一个已存储设备simhash值与本次采集得到的设备simhash值的海明距离小于判定阈值,则表示两台设备之间的相似度很高,判定本文档来自技高网...

【技术保护点】
一种用户设备指纹的提取和识别方法,其特征在于,该方法包括以下步骤:1)通过设置在页面中的脚本收集访问该页面的用户设备系统信息;2)解析用户设备系统信息,获取该用户设备的系统时间,并计算系统时间与世界标准时间的时钟偏移速度;3)根据所述时钟偏移速度和用户设备系统信息计算该用户设备的simhash值,并用该simhash值作为设备识别指纹。

【技术特征摘要】
1.一种用户设备指纹的提取和识别方法,其特征在于,该方法包括以下步骤:1)通过设置在页面中的脚本收集访问该页面的用户设备系统信息;2)解析用户设备系统信息,获取该用户设备的系统时间,并计算系统时间与世界标准时间的时钟偏移速度;3)根据所述时钟偏移速度和用户设备系统信息计算该用户设备的simhash值,并用该simhash值作为设备识别指纹。2.根据权利要求1所述的方法,其特征在于,还包括:计算该用户设备的simhash值与存储的各用户设备simhash值之间的海明距离;如果有一个海明距离小于判定阈值,则判定该用户设备与对应的存储的用户设备为同一设备,否则判定该用户设备为新设备,并存储该用户设备的simhash值。3.根据权利要求1或2所述的方法,其特征在于,所述用户设备系统信息包括系统版本、浏览器的版本、浏览器语言、浏览器插件信息。4.根据权利要求3所述的方法,其特征在于,所述用户设备系统信息还包括以下一种或其任一组合:用户代理信息、浏览器生产商和时区。5.根据权利要求3所述的方法,其特征在于,所述用户设备系统信息还包括以下任一种或两种的组合:使用浏览器窗口对象的屏幕子对象收集的当前屏幕的显示窗口信息,所述显示窗口信息至少包括屏幕分辨率和颜色深度;使用flash脚本收集的当前系统的flash版本信息、系统字符集、音频信息和系统语言。6.根据权利要求1或2所述的方法,其特征在于,还包括:解析浏览器客户端的ip地址,获取...

【专利技术属性】
技术研发人员:朱麟荣季虎
申请(专利权)人:苏宁云商集团股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1