确定设备指纹同源性的方法及装置制造方法及图纸

技术编号:20425440 阅读:22 留言:0更新日期:2019-02-23 08:35
本发明专利技术公开了一种确定设备指纹同源性的方法及装置,涉及互联网技术领域。该方法的一具体实施方式包括:获取第一设备指纹和第二设备指纹;根据第一设备指纹确定第一相似性哈希值;根据第二设备指纹确定第二相似性哈希值;确定所述第一相似性哈希值和所述第二相似性哈希值之间的相似度;当所述相似度小于预设阈值时确定所述第一设备指纹和所述第二设备指纹同源。该实施方式通过采用相似性哈希算法计算设备指纹的得到相应的相似性哈希值,并根据不同的设备指纹所对应的相似性哈希值之间的相似度来确定这些不同的设备指纹是否同源,从而能够用于从所采集的海量的设备指纹数据中搜索发现设备聚集性所在,以发现异常设备或者异常用户操作行为。

【技术实现步骤摘要】
确定设备指纹同源性的方法及装置
本专利技术涉及互联网
,尤其涉及一种确定设备指纹同源性的方法及装置。
技术介绍
随着互联网技术的不断发展,越来越多的交易从线下转移到了线上。由于互联网交易双方的身份具有隐蔽性,欺诈团伙看到了其中的“商机”,他们通过分析各大互联网公司的业务和技术漏洞来实施各种欺诈或者攻击行为。例如,同一用户或者大量用户使用同一个设备向服务端发送大量请求,称为“设备聚集性”。批量注册,撞库登录,批量下单等行为都会有出现这种集中使用同一个设备的情况。理论上如果能够给每个设备分配一个唯一的设备id,那么可以通过设备id发现这种聚集性异常,但是JS设备指纹的特点决定了给每个设备分配唯一的id是不可能的,所以需要通过相似性来发现设备的这种聚集性。各个互联网公司针对这些网络欺诈行为都会建立相应的风控手段来防范黑产用户,保障正常用户的资金财产安全。风控核心的目标是防范账号背后的人,但是互联网的特点又注定了只通过用户线上的行为无法唯一确定用户的身份。JS设备指纹技术(设备指纹是指可以用于唯一标识出该设备的设备特征或者独特的设备标识)是通过在前端页面埋入JavaScript代码,当用户用浏览器访问该页面时,JavaScript代码会采集用户设备的各种信息,信息采集完成后这些信息上报到服务器,服务器会根据采集的信息给当前设备分配一个唯一的id,当用户下次访问相同的页面的时候,服务器会根据采集的信息返回相同的id。这种方法可以保证生成的设备id的唯一性,但是往往稳定性无法保证。因为JavaScript是前端技术,部署在前端的代码采集的各种数据很容易被篡改,篡改后的设备指标上报到服务器之后,服务器可能就查询不到当前设备信息对应的设备id了。虽然这种问题可以通过在客户端增加缓存,以及服务端用某些唯一性强的指标来标识该设备,但是只要用户清除缓存,修改强依赖的指标,设备的id就无法追踪。随着黑产技术的不断提升,不良用户可以通过各种工具轻易的修改诸如IP,UserAgent(用户代理)等指标,从而达到隐藏自己设备的目的,设备指纹就无法实现设备识别的目的。风控中通常会通过设备聚集性来判断一个设备上的用户是否有风险,因为风险用户会在相同的设备上进行大量相似的操作。如果设备的id发生了变化,那么聚集性分析就无法实现。
技术实现思路
有鉴于此,本专利技术实施例提供一种确定设备指纹同源性的方法和装置,以及一种异常设备发现方法及装置,能够有效的从所采集的海量的设备指纹数据中搜索发现设备聚集性所在,以发现异常设备或者异常用户操作行为,为风控的实施决策提供依据。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种确定设备指纹同源性的方法,包括:获取第一设备指纹和第二设备指纹;根据所述第一设备指纹确定第一相似性哈希值;根据所述第二设备指纹确定第二相似性哈希值;确定所述第一相似性哈希值和所述第二相似性哈希值之间的相似度;当所述相似度小于预设阈值时确定所述第一设备指纹和所述第二设备指纹同源。可选的,所述根据所述第一设备指纹确定所述第一相似性哈希值包括:对所述第一设备指纹进行分词处理以得到多个关键词;对所述多个关键词进行哈希计算以得到多个关键词哈希值;根据所述多个关键词哈希值确定所述第一相似性哈希值。可选的,所述根据所述多个关键词哈希值确定所述第一相似性哈希值包括:对所述多个关键词哈希值进行加权求和以确定所述第一相似性哈希值;其中,每个所述关键词哈希值的权重根据关键词的逆文本频率指数确定。可选的,所述第一设备指纹和所述第二设备指纹分别包括以下至少之一:相应设备的操作系统名称、操作系统版本、字体列表、插件列表。为实现上述目的,根据本专利技术实施例的另一方面,提供了一种异常设备发现方法,包括:确定当前用户的设备指纹,计算当前用户的设备指纹的相似性哈希值,将所述当前用户的设备指纹的相似性哈希值当前相似性哈希值作为当前相似性哈希值数据;计算设备指纹库中的多个设备指纹的多个相似性哈希值;查询并确定所述相似性哈希值库中与所述当前相似性哈希值数据之间的相似度小于预设阈值的相似性哈希值数据的个数;当所述个数大于设定值时,确定当前用户的设备为异常设备。可选的,所述方法还包括:将相似性哈希值划分为多个子部;将所述多个子部中的每一个部分作为索引分别与所属的相似性哈希值关联存储。可选的,所述当前相似性哈希值数据包括所述当前相似性哈希值和所述当前相似性哈希值所对应的多个子部;所述查询并确定所述相似性哈希值库中与所述当前相似性哈希值数据之间的相似度值小于预设阈值的相似性哈希值数据的个数包括:以所述当前相似性哈希值的多个子部中的任意一个作为索引,在相似性哈希值库中查询与所述索引相同的子部,将与所述索引相同的子部对应的相似性哈希值作为候选哈希值;分别计算所述候选哈希值中的每一个相似性哈希值与所述当前相似性哈希值之间的相似度,以得到多个相似度;从所述多个相似度中,确定小于预设阈值的相似度的个数。为实现上述目的,根据本专利技术实施例的又一方面,提供了一种确定设备指纹同源性的装置,包括:信息获取模块,用于获取第一设备指纹和第二设备指纹;第一哈希值确定模块,用于根据所述第一设备指纹确定第一相似性哈希值;第二哈希值确定模块,用于根据所述第二设备指纹确定第二相似性哈希值;相似度计算模块,用于确定所述第一相似性哈希值和所述第二相似性哈希值之间的相似度;同源确定模块,用于当所述相似度小于预设阈值时确定所述第一设备指纹和所述第二设备指纹同源。可选的,所述第一哈希值确定模块包括:分词处理单元,用于对所述第一设备指纹进行分词处理以得到多个关键词;词哈希值确定单元,用于对所述多个关键词进行哈希计算以得到多个关键词哈希值;第一哈希值确定单元,用于根据所述多个关键词哈希值确定所述第一相似性哈希值。可选的,所述根据所述多个关键词哈希值确定所述第一相似性哈希值包括:对所述多个关键词哈希值进行加权求和以确定所述第一相似性哈希值;其中,每个所述关键词哈希值的权重根据关键词的逆文本频率指数确定。可选的,所述第一设备指纹和所述第二设备指纹分别包括以下至少之一:相应设备的操作系统名称、操作系统版本、字体列表、插件列表。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种异常设备发现装置,包括:当前哈希值确定模块,用于获取当前用户的设备指纹,计算当前用户的设备指纹的相似性哈希值,将所述当前用户的设备指纹的相似性哈希值当前相似性哈希值作为当前相似性哈希值数据;计算模块,用于计算所述设备指纹库中的多个设备指纹的多个相似性哈希值;查询确定模块,用于查询并确定所述相似性哈希值库中与所述当前相似性哈希值数据之间的相似度小于预设阈值的相似性哈希值数据的个数;异常设备确定模块,用于当所述个数大于设定值时,确定当前用户的设备为异常设备。可选的,所述计算模块包括:将相似性哈希值划分为多个子部;将所述多个子部中的每一个部分作为索引分别与所属的相似性哈希值关联存储。可选的,所述当前相似性哈希值数据包括所述当前相似性哈希值和所述当前相似性哈希值所对应的多个子部;所述查询确定模块还用于:以所述当前相似性哈希值的多个子部中的任意一个作为索引,在相似性哈希值库中查询与所述索引相同的子部,将与所述索引相同的子部对应的相似性哈希值作为候选哈希值;本文档来自技高网
...

【技术保护点】
1.一种确定设备指纹同源性的方法,其特征在于,包括:获取第一设备指纹和第二设备指纹;根据所述第一设备指纹确定第一相似性哈希值;根据所述第二设备指纹确定第二相似性哈希值;确定所述第一相似性哈希值和所述第二相似性哈希值之间的相似度;当所述相似度小于预设阈值时确定所述第一设备指纹和所述第二设备指纹同源。

【技术特征摘要】
1.一种确定设备指纹同源性的方法,其特征在于,包括:获取第一设备指纹和第二设备指纹;根据所述第一设备指纹确定第一相似性哈希值;根据所述第二设备指纹确定第二相似性哈希值;确定所述第一相似性哈希值和所述第二相似性哈希值之间的相似度;当所述相似度小于预设阈值时确定所述第一设备指纹和所述第二设备指纹同源。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一设备指纹确定所述第一相似性哈希值包括:对所述第一设备指纹进行分词处理以得到多个关键词;对所述多个关键词进行哈希计算,以得到多个关键词哈希值;根据所述多个关键词哈希值确定所述第一相似性哈希值。3.根据权利要求2所述的方法,其特征在于,所述根据所述多个关键词哈希值确定所述第一相似性哈希值包括:对所述多个关键词哈希值进行加权求和以确定所述第一相似性哈希值;其中,每个所述关键词哈希值的权重根据关键词的逆文本频率指数确定。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述第一设备指纹和所述第二设备指纹分别包括以下至少之一:相应设备的操作系统名称、操作系统版本、字体列表、插件列表。5.一种异常设备发现方法,其特征在于,包括:确定当前用户的设备指纹,计算当前用户的设备指纹的相似性哈希值,将所述当前用户的设备指纹的相似性哈希值作为当前相似性哈希值数据;计算设备指纹库中的多个设备指纹的多个相似性哈希值;查询并确定所述相似性哈希值库中与所述当前相似性哈希值数据之间的相似度小于预设阈值的相似性哈希值数据的个数;当所述个数大于设定值时,确定当前用户的设备为异常设备当前用户的设备为异常设备。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:将相似性哈希值划分为多个子部;将所述多个子部中的每一个部分作为索引分别与所属的相似性哈希值关联存储。7.根据权利要求6所述的方法,其特征在于,所述当前相似性哈希值数据包括所述当前相似性哈希值和所述当前相似性哈希值所对应的多个子部;所述查询并确定所述相似性哈希值库中与所述当前相似性哈希值数据之间的相似度值小于预设阈值的相似性哈希值数据的个数包括:以所述当前相似性哈希值的多个子部中的任意一个作为索引,在相似性哈希值库中查询与所述索引相同的子部,将与所述索引相同的子部对应的相似性哈希值作为候选哈希值;分别计算所述候选哈希值中的每一个相似性哈希值与所述当前相似性哈希值之间的相似度,以得到多个相似度;从所述多个相似度中,确定小于预设阈值的相似度的个数。8.一种确定设备指纹同源性的装置,其特征在于,包括:信息获取模块,用于获取第一设备指纹和第二设备指纹;第一哈希值确定模块,用于根据所述第一设备指纹确定第一相似性哈希值;第二哈希值确定模块,用于根据所述第二设备指纹...

【专利技术属性】
技术研发人员:陈海龙
申请(专利权)人:北京京东金融科技控股有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1