人机流量鉴别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:20049618 阅读:36 留言:0更新日期:2019-01-09 05:44
本发明专利技术公开了人机流量鉴别方法、装置、计算机设备及存储介质,其中方法可包括:当访问者访问业务页面时,嵌入在业务页面的采集代码获取访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;采集代码将设备属性信息上报给云端,以便云端根据设备属性信息确定出业务流量的人机属性。应用本发明专利技术所述方案,能够提高处理结果的准确性等。

【技术实现步骤摘要】
人机流量鉴别方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用技术,特别涉及人机流量鉴别方法、装置、计算机设备及存储介质。
技术介绍
目前,如黑产经常会使用IP池、肉机、群控等方式批量驱动浏览器客户端来对Web站点发起请求,从而达到爬取网站内容、广告点击欺诈、薅羊毛等目的。其中,黑产即黑色产业,通常是指利用病毒木马等来获取利益的行业。薅羊毛是指参与银行等金融机构或各类商家开展的一些优惠活动等,从而获得优惠乃至金钱上的回报。为了保护站点利益,需要进行人机流量鉴别,以区分业务流量的人机属性,即业务流量来自于正常的用户操作还是来自于黑产等机器操作,进而可对机器操作采取相应的应对措施。现有技术中,主要通过外网IP来实现人机流量鉴别,但外网IP很容易被篡改等,从而使得这种方式存在很大的误判率,即处理结果的准确性较低。
技术实现思路
有鉴于此,本专利技术提供了人机流量鉴别方法、装置、计算机设备及存储介质。具体技术方案如下:一种人机流量鉴别方法,包括:当访问者访问业务页面时,嵌入在所述业务页面的采集代码获取所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;所述采集代码将所述设备属性信息上报给云端,以便所述云端根据所述设备属性信息确定出业务流量的人机属性。一种人机流量鉴别方法,包括:云端获取嵌入业务页面的采集代码上报的设备属性信息,所述设备属性信息为当访问者访问所述业务页面时,所述采集代码获取到的所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;所述云端根据所述设备属性信息确定出业务流量的人机属性。一种人机流量鉴别装置,包括:采集单元以及上报单元;所述采集单元,用于当访问者访问业务页面时,获取所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;所述上报单元,用于将所述设备属性信息上报给云端,以便所述云端根据所述设备属性信息确定出业务流量的人机属性。一种人机流量鉴别装置,包括:获取单元以及鉴别单元;所述获取单元,用于获取嵌入业务页面的采集代码上报的设备属性信息,所述设备属性信息为当访问者访问所述业务页面时,所述采集代码获取到的所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;所述鉴别单元,用于根据所述设备属性信息确定出业务流量的人机属性。一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。基于上述介绍可以看出,采用本专利技术所述方案,可获取访问者设备的深度属性信息,进而可根据深度属性信息进行人机流量鉴别,深度属性信息不易篡改,因此黑产等伪造这类信息会比较困难,相应地,基于这类信息可以更为准确地确定出人机属性,即提高了处理结果的准确性等。【附图说明】图1为本专利技术所述人机流量鉴别方法第一实施例的流程图。图2为本专利技术所述人机流量鉴别方法第二实施例的流程图。图3为本专利技术所述人机流量鉴别装置第一实施例的组成结构示意图。图4为本专利技术所述人机流量鉴别装置第二实施例的组成结构示意图。图5示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。【具体实施方式】为了使本专利技术的技术方案更加清楚、明白,以下参照附图并举实施例,对本专利技术所述方案进行进一步说明。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。图1为本专利技术所述人机流量鉴别方法第一实施例的流程图。如图1所示,包括以下具体实现方式。在101中,当访问者访问业务页面时,嵌入在业务页面的采集代码获取访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息。在102中,采集代码将获取到的设备属性信息上报给云端,以便云端根据获取到的设备属性信息确定出业务流量的人机属性。可预先在业务页面中嵌入采集代码,较佳地,采集代码可为JavaScript代码,JavaScript一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型。业务页面即指运营活动页等,如用户可以在这个页面上进行抽奖、抢红包等操作。当访问者每次访问业务页面时,嵌入在业务页面中的采集代码均可获取访问者的设备属性信息。设备属性信息可包括预定的不易篡改的深度属性信息。获取哪些深度属性信息可根据实际需要预先设定。较佳地,深度属性信息可至少包括以下之一或任意组合:系统类型信息、画布(Canvas)指纹信息、显卡信息、电池信息、传感器信息、网络地址转换(NAT)信息。除上述深度属性信息之外,采集代码获取到的设备属性信息中还可进一步包括:用户代理(UserAgent)信息,UserAgent信息为非深度属性信息。其中,UserAgent简称UA,是一个特殊字符串头,使得服务器能够识别用户使用的操作系统及版本、中央处理单元(CPU,CentralProcessingUnit)类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。系统类型通常是指操作系统类型。Canvas是超文本标记语言(HTML,HyperTextMarkupLanguage)5中用于图形绘制的元素,通过脚本来绘制图形,Canvas拥有多种绘制路径、矩形、圆形、字符以及添加图像的方法。从根本上来说,每一种浏览器都会使用不同的图形处理引擎,不同的导出选项,不同的压缩等级,所以每一台设备绘制出的图形都会有些许不同,这些图形可以被用来给设备分配特定编号,即Canvas指纹,也就是说,可以用Canvas指纹来识别不同的设备。显卡信息,通常包括显卡的名称、制造商信息等。电池信息可以包括电池状态信息,如是否正在充电,如果正在充电,可进一步包括当前已充电量、还需要多长时间可以完成充电等信息,如果没在充电,可进一步包括当前剩余电量、多长时间电量将耗尽等信息。传感器信息可以是指陀螺仪以及重力加速度等传感器信息。NAT是一种把内部私有网络地址翻译成合法网络IP地址的技术,简单的说,NAT就是在局域网内部网络中使用内部地址,而当内部设备要与外部网络进行通讯时,就在网关处,将内部地址替换成外网地址,从而在外部公网internet上正常使用。上述各设备属性信息中,系统类型、显卡信息以及NAT信息等为浏览器属性信息,其它为系统属性信息。JavaScript代码获取到设备属性信息后,可将其上报给云端,以便云端根据获取到的设备属性信息确定出业务流量的人机属性。以下通过具体实施例,对云端一侧的处理方式进行说明。图2为本专利技术所述人机流量鉴别方法第二实施例的流程图。如图2所示,包括以下具体实现方式。在201中,云端获取嵌入业务页面的采集代码上报的设备属性信息,所述设备属性信息为当访问者访问业务页面时,采集代码获取到的访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息。在202中,云端根据获取到的设备属性信息确定出业务流量的人机属性。可预先在业务页面中嵌入采集代码,较佳地,采集代码可为JavaScript代码。当访问者每次访问业务页面时,嵌本文档来自技高网...

【技术保护点】
1.一种人机流量鉴别方法,其特征在于,包括:当访问者访问业务页面时,嵌入在所述业务页面的采集代码获取所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;所述采集代码将所述设备属性信息上报给云端,以便所述云端根据所述设备属性信息确定出业务流量的人机属性。

【技术特征摘要】
1.一种人机流量鉴别方法,其特征在于,包括:当访问者访问业务页面时,嵌入在所述业务页面的采集代码获取所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;所述采集代码将所述设备属性信息上报给云端,以便所述云端根据所述设备属性信息确定出业务流量的人机属性。2.根据权利要求1所述的方法,其特征在于,所述深度属性信息至少包括以下之一或任意组合:系统类型信息、画布Canvas指纹信息、显卡信息、电池信息、传感器信息、网络地址转换NAT信息。3.根据权利要求1所述的方法,其特征在于,所述设备属性信息进一步包括:用户代理UserAgent信息,所述UserAgent信息为非深度属性信息。4.一种人机流量鉴别方法,其特征在于,包括:云端获取嵌入业务页面的采集代码上报的设备属性信息,所述设备属性信息为当访问者访问所述业务页面时,所述采集代码获取到的所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡改的深度属性信息;所述云端根据所述设备属性信息确定出业务流量的人机属性。5.根据权利要求4所述的方法,其特征在于,所述深度属性信息至少包括以下之一或任意组合:系统类型信息、画布Canvas指纹信息、显卡信息、电池信息、传感器信息、网络地址转换NAT信息。6.根据权利要求4所述的方法,其特征在于,所述设备属性信息进一步包括:用户代理UserAgent信息,所述UserAgent信息为非深度属性信息。7.根据权利要求4所述的方法,其特征在于,所述云端根据所述设备属性信息确定出业务流量的人机属性包括以下之一或全部:所述云端通过对所述设备属性信息进行分析,确定出所述人机属性;所述云端通过将所述设备属性信息与所保存的判定为正常的设备属性信息进行比对,确定出所述人机属性。8.根据权利要求4所述的方法,其特征在于,该方法进一步包括:所述云端将所述人机属性确定结果在线返回给所述业务页面对应的站点;或者,所述云端将所述人机属性确定结果离线返回给所述站点。9.一种人机流量鉴别装置,其特征在于,包括:采集单元以及上报单元;所述采集单元,用于当访问者访问业务页面时,获取所述访问者的设备属性信息,所述设备属性信息包括预定的不易篡...

【专利技术属性】
技术研发人员:房勇邱喆彬董姗姗程诚魏颖
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1