上网设备用户的检测方法、装置、存储介质及服务器制造方法及图纸

技术编号:21513878 阅读:25 留言:0更新日期:2019-07-03 09:02
本发明专利技术涉及数据处理领域,具体涉及一种上网设备用户的检测方法、装置、存储介质及服务器,所述方法包括:通过预置的埋点信息,收集上网设备用户注册时的特征数据;根据所述特征数据,确定所述特征数据的取值分布,根据所述取值分布基于业务场景生成场景特征;根据所述场景特征构建场景特征模型,所述场景特征模型包括异常检测模型和真伪判断模型;获取上网设备用户的当前特征数据,将所述当前特征数据应用于所述异常检测模型和真伪判断模型,获取异常检测结果及真伪判断结果;根据所述异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型。本发明专利技术提高了人机识别的准确率,有效的解决反爬虫策略覆盖不全的问题。

Inspection methods, devices, storage media and servers for users of networking equipment

【技术实现步骤摘要】
上网设备用户的检测方法、装置、存储介质及服务器
本专利技术涉及数据处理领域,具体涉及一种上网设备用户的检测方法、装置、存储介质及服务器。
技术介绍
随着互联网技术的发展,应用程序的功能也越来越丰富,网页网站的信息繁多,并且在互联网上举行的活动越来越丰富,如应用程序上举办的活动,而目前存在通过机器注册参与互联网举办活动的行为,导致网站或应用的安全得不到保障,活动无法正常进行,包括通过网络爬虫大量访问某个活动页面,导致页面无法正常访问,例如通过按键精灵等自动化工具模仿真实用户行为,从而制造与真实用户的不平衡体验,而由于爬虫策略及自动化工具的技术手段不断提升,目前的反爬虫策略及自动化机器的检测策略无法及时应对,造成在活动举办后网站或应用无法及时针对该些爬虫或自动化工具进行侦查,导致网站安全受到威胁,应用活动无法正常举办的现象。
技术实现思路
为克服以上技术问题,特别是现有技术无法实时、准确地进行人机检测的问题,特提出以下技术方案:第一方面,本专利技术提供了一种上网设备用户的检测方法,包括:通过预置的埋点信息,收集上网设备用户注册时的特征数据;根据所述特征数据,确定所述特征数据的取值分布,根据所述取值分布基于业务场景生成场景特征;根据所述场景特征构建场景特征模型,所述场景特征模型包括异常检测模型和真伪判断模型;获取上网设备用户的当前特征数据,将所述当前特征数据应用于所述异常检测模型和真伪判断模型,获取异常检测结果及真伪判断结果;根据所述异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型。进一步的,所述获取上网设备用户的当前特征数据之后,还包括:获取所述当前特征数据中的关联数据,所述关联数据包括第一特征数据及第二特征数据;根据所述第一特征数据,确定所述第一特征数据的取值分布,根据所述第一特征数据的取值分布基于业务场景生成第一场景特征;根据所述第二特征数据,确定所述第二特征数据的取值分布,根据所述第二特征数据的取值分布基于业务场景生成第二场景特征;比较所述第一场景特征与所述第二场景特征的差异度,根据所述差异度确定所述关联数据的准确度。进一步的,所述根据所述异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型,包括:获取异常检测模型和真伪判断模型的权重,根据所述异常检测结果及真伪判断结果及权重,生成最终检测结果;将所述最终检测结果与设定阈值相比较,若所述最终检测结果低于或等于第一设定阈值,确定所述上网设备用户为正常用户;若所述最终检测结果高于或等于第二设定阈值,确定所述上网设备用户为异常用户;若所述最终检测结果高于第一设定阈值且低于第二设定阈值,确定所述上网设备用户为灰度用户。进一步的,所述确定所述上网设备用户为灰度用户之后,还包括:将所述正常用户添加进白名单,将所述异常用户及所述灰度用户添加进灰名单;根据预置的白名单及灰名单的作业频率,获取所述白名单中的正常用户或灰名单中的异常用户及灰度用户的特征数据。进一步的,所述确定所述上网设备用户为正常用户之后,还包括:通过所述正常用户的上网设备的验证;所述确定所述上网设备用户为异常用户之后,还包括:限制所述异常用户的上网设备的验证;所述确定所述上网设备用户为灰度用户之后,还包括:通过所述灰度用户的上网设备的验证,并降低为所述灰度用户的上网设备分配的资源。进一步的,所述根据所述场景特征构建场景特征模型,包括:根据所述场景特征并采用贝叶斯算法和one_class支持向量机算法构建场景特征模型。第二方面,本专利技术提供一种上网设备用户的检测装置,包括:埋点模块:用于通过预置的埋点信息,收集上网设备用户注册时的特征数据;场景特征模块:用于根据所述特征数据,确定所述特征数据的取值分布,根据所述取值分布基于业务场景生成场景特征;模型构建模块:用于根据所述场景特征构建场景特征模型,所述场景特征模型包括异常检测模型和真伪判断模型;检测模块:用于获取上网设备用户的当前特征数据,将所述当前特征数据应用于所述异常检测模型和真伪判断模型,获取异常检测结果及真伪判断结果;分类模块:用于根据所述异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型。进一步的,所述分类模块包括执行:获取异常检测模型和真伪判断模型的权重,根据所述所述异常检测结果及真伪判断结果及权重,生成最终检测结果;将所述最终检测结果与设定阈值相比较,若所述最终检测结果低于第一设定阈值,确定所述上网设备用户为正常用户;若所述最终检测结果高于第二设定阈值,确定所述上网设备用户为异常用户;若所述最终检测结果高于第一设定阈值且低于第二设定阈值,确定所述上网设备用户为灰度用户。第三方面,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述的上网设备用户的检测方法。第四方面,本专利技术还提供了一种服务器,所述服务器包括一个或多个处理器、存储器、一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的上网设备用户的检测方法。本专利技术与现有技术相比,具有以下有益效果:本专利技术提供了一种从用户终端设备信息数据是否异常的角度,检测该终端设备用户是否为真实用户的方法,在用户在进行注册、验证时,通过预置的埋点信息,收集上网设备用户注册时的特征数据,此时的特征数据为上网设备用户的静态特征数据,然后基于所述静态特征数据构建场景特征模型包括异常检测模型和真伪判断模型,当再次获取上网设备用户的当前特征数据时,该当前特征数据为动态特征数据,将该动态特征数据应用于所述异常检测模型和真伪判断模型,获取异常检测结果及真伪判断结果,再通过比较异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型,通过上网设备用户的静态特征数据及动态特征数据的比较,能够动态、准确、快速地确定上网设备用户的分类类型,动态地识别出上网设备用户是否为爬虫机器,避免反爬虫策略无法及时更新而无法识别出爬虫机器的干扰,同时避免将真实用户判别为异常用户,影响用户的后续作业,从而提高真实用户作业的效率。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术上网设备用户的检测方法的一实施例流程示意图;图2为本专利技术上网设备用户的检测方法的另一实施例流程示意图;图3为本专利技术上网设备用户的检测装置的一实施例示意图;图4为本专利技术服务器的一实施例结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。本
技术人员可以理解,除非另外定义,这里使用的所有术语本文档来自技高网
...

【技术保护点】
1.一种上网设备用户的检测方法,其特征在于,包括:通过预置的埋点信息,收集上网设备用户注册时的特征数据;根据所述特征数据,确定所述特征数据的取值分布,根据所述取值分布基于业务场景生成场景特征;根据所述场景特征构建场景特征模型,所述场景特征模型包括异常检测模型和真伪判断模型;获取上网设备用户的当前特征数据,将所述当前特征数据应用于所述异常检测模型和真伪判断模型,获取异常检测结果及真伪判断结果;根据所述异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型。

【技术特征摘要】
1.一种上网设备用户的检测方法,其特征在于,包括:通过预置的埋点信息,收集上网设备用户注册时的特征数据;根据所述特征数据,确定所述特征数据的取值分布,根据所述取值分布基于业务场景生成场景特征;根据所述场景特征构建场景特征模型,所述场景特征模型包括异常检测模型和真伪判断模型;获取上网设备用户的当前特征数据,将所述当前特征数据应用于所述异常检测模型和真伪判断模型,获取异常检测结果及真伪判断结果;根据所述异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型。2.根据权利要求1所述的方法,其特征在于,所述获取上网设备用户的当前特征数据之后,还包括:获取所述当前特征数据中的关联数据,所述关联数据包括第一特征数据及第二特征数据;根据所述第一特征数据,确定所述第一特征数据的取值分布,根据所述第一特征数据的取值分布基于业务场景生成第一场景特征;根据所述第二特征数据,确定所述第二特征数据的取值分布,根据所述第二特征数据的取值分布基于业务场景生成第二场景特征;比较所述第一场景特征与所述第二场景特征的差异度,根据所述差异度确定所述关联数据的准确度。3.根据权利要求1所述的方法,其特征在于,所述根据所述异常检测结果及真伪判断结果,确定所述上网设备用户的分类类型,包括:获取异常检测模型和真伪判断模型的权重,根据所述异常检测结果及真伪判断结果及权重,生成最终检测结果;将所述最终检测结果与设定阈值相比较,若所述最终检测结果低于或等价于第一设定阈值,确定所述上网设备用户为正常用户;若所述最终检测结果高于或等于第二设定阈值,确定所述上网设备用户为异常用户;若所述最终检测结果高于第一设定阈值且低于第二设定阈值,确定所述上网设备用户为灰度用户。4.根据权利要求3所述的方法,其特征在于,所述确定所述上网设备用户为灰度用户之后,还包括:将所述正常用户添加进白名单,将所述异常用户及所述灰度用户添加进灰名单;根据预置的白名单及灰名单的作业频率,获取所述白名单中的正常用户或灰名单中的异常用户及灰度用户的特征数据。5.根据权利要求3所述的方法,其特征在于,所述确定所述上网设备用户为正常用户之后,还包括:通过所述正...

【专利技术属性】
技术研发人员:李敏
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1