一种基于轨迹的滑动验证码人机识别方法技术

技术编号:18458954 阅读:362 留言:0更新日期:2018-07-18 12:46
本发明专利技术公开了一种基于轨迹的滑动验证码人机识别方法,包括以下步骤:采集用户轨迹数据;根据轨迹数据构建多维特征体系;根据设计好的人机识别模型对多维特征体系进行轨迹区分。本发明专利技术中,通过结合人类轨迹的两种现象进行多维特征体系的设计,用特征描述用户的滑动验证码习惯,进而将用户操作与机器模仿进行区别开来,在与攻击者的黑产工具的对抗中能占据优势,起到较好的对抗保护作用。

A path based sliding mode verification code for man-machine recognition

The invention discloses a human-computer recognition method of sliding verification code based on trajectory, which includes the following steps: collecting user trajectory data, constructing multidimensional feature system according to the trajectory data, and differentiating the multidimensional feature system according to the designed man-machine recognition model. In this invention, the design of multidimensional feature system is carried out by combining the two phenomena of human trajectory. The feature describes the user's sliding verification code habit, and then distinguishes the user operation from the machine imitation. It can take advantage in the confrontation with the attacker's black production tool and play a better protective effect.

【技术实现步骤摘要】
一种基于轨迹的滑动验证码人机识别方法
本专利技术涉及生物认证
,尤其涉及一种基于轨迹的滑动验证码人机识别方法。
技术介绍
滑动验证码作为一种生物认证技术,能够满足当前网络环境对身份认证安全性需求,已经广泛应用于多种人机验证产品中,此验证方法不仅便于用户的理解记忆,同时极大增加了暴力破解难度。与此同时,也受到了攻击者们的重点关注,攻击者们开发出能够模仿人类行为的黑产工具开始对滑动验证码验证过程中的鼠标轨迹进行挑战。攻击者通过黑产工具产生类人轨迹批量操作以绕过检测,并在对抗过程中不断升级其伪造数据以持续绕过同样升级的检测技术。现有检测技术主要针对机器进行识别,针对不断更新的机器行为进行对抗的方式具有滞后性,检测更新往往在黑产工具造成一定损失之后。因此,在双方都不断升级的技术对抗中,如何在与攻击者的黑产工具的对抗中占据优势,就显得尤为重要。
技术实现思路
本专利技术的目的在于:提供一种基于轨迹的滑动验证码人机识别方法,旨在构建多维有效特征体系对滑动验证码的触发者进行识别,确保验证行为所保护的网络环境的安全。本专利技术采用的技术方案如下:一种基于轨迹的滑动验证码人机识别方法,包括以下步骤:S1:采集用户轨迹数据;S2:根据轨迹数据构建多维特征体系;S3:根据设计好的人机识别模型对多维特征体系进行轨迹区分。进一步的,所述多维特征体系包括X特征、Y特征、T特征。进一步的,所述X特征提取具体步骤如下:S201:提取X特征类,对轨迹横向坐标x进行归一化处理;S202:将轨迹横向坐标分为前半段和后半段;S203:分别提取轨迹前半段xfront、后半段xrear、前半段领位差xfrontdiff、后半段领位差xreardiff、停止段finalstop多个X特征群;S204:提取每个X特征群中的特征,包括最大值、峰值、中值、方差、最小值、极差。进一步的,所述Y特征提取具体步骤如下:S211:提取Y特征类,对轨迹纵向坐标y进行归一化处理;S212:分别提取轨迹全段y、折半yhalf、全段邻位差ydiff、全段邻位差的邻位差ydiffdiff多个Y特征群;S213:提取每个Y特征群中的特征,包括方差、平均值、极差、和值。进一步的,所述T特征提取具体步骤如下:S221:提取T特征类,对时间特征t进行归一化处理;S222:提取T-X特征群,利用归一化后的横向坐标x减去归一化后的时间特征t;S223:提取T-X特征群中的特征,包括最大值、峰值、中值、方差、最小值、极差。进一步的,所述步骤S3人机识别模型设计具体步骤如下:S301:将多维特征体系中的特征输入到多个训练模型中进行算法训练;S302:将特征算法训练输出进行线性加权。进一步的,所述训练模型包括:CatBoost模型、XGBoost模型、RandomForest模型、LogisticRegression模型。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、本专利技术中,通过结合人类轨迹的两种现象进行多维特征体系的设计,用特征描述用户的滑动验证习惯,进而将用户操作与机器模仿进行区别开来,在与攻击者的黑产工具的对抗中能占据优势,起到较好的对抗保护作用。2、本专利技术中,通过采用横向特征x为主,描述“人”在进行滑动验证码时的行为习惯,并用纵向特征y描述“机器”的特点,用时间特征t作为补充描述“人”与“机器”的区别,能够更加准确的将用户操作与机器模仿进行区别开来,提高轨迹区分的正确率。3、本专利技术中,实际验证效果在200万条轨迹记录的测试集上,准确率、召回率的调和F值达到88.56,远高于以描述“机器”为主的方案的效果87.89。附图说明图1为本专利技术多维特征体系特征关系图;图2为本专利技术多维特征体系概念图;图3为本专利技术人机识别模型关系图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。实施例1一种基于轨迹的滑动验证码人机识别方法,包括以下步骤:S1:采集用户轨迹数据;采集用户轨迹数据(x,y,t),包括轨迹触发过程中,不同时间点t的横向坐标x,纵向坐标y,具体来说,就是获得用户在进行滑动验证码码触发过程的轨迹记录,为滑动验证码码多维特征体系的构建提供数据支持。S2:根据轨迹数据构建多维特征体系;基于两种模式的发现,其一,人类轨迹的末端折回现象;其二,人类轨迹的远急近缓现象;进行多维特征提取,进而构建多维特征体系,便于后期人机识别模型的算法训练,用特征描述“人”,而非用特征描述‘机器’,寻二者之异。S3:根据设计好的人机识别模型对多维特征体系进行轨迹区分;将多维特征体系特征输入设计好的人机识别模型进行人机识别模型优化,将多维特征体特征输入人机识别模型进行特征学习,得到不同的概率值,通过线性加权的方式让人机识别模型输出的概率更能接近轨迹的真实类型。本专利技术中,通过对人类轨迹进行分析,基于两种模式的发现,模式一:人类轨迹的折回现象,模式二:人类轨迹的远急近缓现象,进行多维度特征体系的构建,进而对人机识别模型进行设计,如图1所示,通过将用户轨迹对应的训练集进行多维特征体系构建,进而对人机识别模型进行训练,并将预测轨迹对应预测集进行相同的多维特征体系构建并输入训练好的人机识别模型中进行模型优化和轨迹类别区分训练,并将训练输出进行线性加权,得到区分轨迹类别的概率值。实施例2在实施例1的基础上,所述多维特征体系包括X特征、Y特征、T特征。本专利技术采用横向特征x为主,描述“人”在进行滑动验证时的行为习惯,并用纵向特征y描述“机器”的特点,用时间特征T作为补充描述“人”与“机器”的区别,如图2所示。进一步的,所述X特征提取具体步骤如下:S201:提取X特征类,对轨迹横向坐标x进行归一化处理;S202:结合人类轨迹模式二的“远急近缓”现象,将将轨迹分为前半段和后半段;具体来说,“远急近缓”表明在滑动验证码的过程中,在离目标点较远时速度较快,在离目标点较近时速度较慢。因此,横向x特征群构造上将轨迹分为前、后半段分别提取。S203:分别提取轨迹前半段xfront、后半段xrear、前半段领位差xfrontdiff、后半段领位差xreardiff、停止段finalstop多个X特征群;结合人类轨迹模式一的“末端折回”现象,构造提取停止段finalstop特征群。具体来说,从轨迹数据(x,y,t)中提取出整个轨迹的横向坐标数据组成横向序列{x1,x2,...,xt,...,xn},取轨迹序列中的前半段{x1,x2,...,xn/2}组成x_front,取轨迹序列中的后半段{xn/2,xn/2+1,...,xn}组成x_rear,取轨迹序列中的前半段的邻位差{x2-x1,x3-x2,...}组成x_front_diff,取轨迹序列中的后半段的邻位差{...,xn-1-xn-2,xn-xn-1}组成x_rear_diff,结合人类轨迹模式一,取轨迹序列中的最后五分之一组成停止段final_stop。S204:提取每个X特征群中的特征,包括最大值、峰值、中值、方差、最小值、极差。本专利技术中,从多维度设计特征体系的横向特征,能够更好的为模型提供输入。进一步的,所述Y特征获取具体步骤如下:S2本文档来自技高网...

【技术保护点】
1.一种基于轨迹的滑动验证码人机识别方法,其特征在于,包括以下步骤:S1:采集用户轨迹数据;S2:根据轨迹数据构建多维特征体系;S3:根据设计好的人机识别模型对多维特征体系进行轨迹区分。

【技术特征摘要】
1.一种基于轨迹的滑动验证码人机识别方法,其特征在于,包括以下步骤:S1:采集用户轨迹数据;S2:根据轨迹数据构建多维特征体系;S3:根据设计好的人机识别模型对多维特征体系进行轨迹区分。2.根据权利要求1所述一种基于轨迹的滑动验证码人机识别方法,其特征在于,所述多维特征体系包括X特征、Y特征、T特征。3.根据权利要求2所述一种基于轨迹的滑动验证码人机识别方法,其特征在于,所述X特征提取具体步骤如下:S201:提取X特征类,对轨迹横向坐标x进行归一化处理;S202:将轨迹横向坐标分为前半段和后半段;S203:分别提取轨迹前半段xfront、后半段xrear、前半段领位差xfrontdiff、后半段领位差xreardiff、停止段finalstop多个X特征群;S204:提取每个X特征群中的特征,包括最大值、峰值、中值、方差、最小值、极差。4.根据权利要求2所述一种基于轨迹的滑动验证码人机识别方法,其特征在于,所述Y特征提取具体步骤如下:S211:提取Y特征类,对轨迹纵向坐标y进行归一化处理;S212...

【专利技术属性】
技术研发人员:张敏陈媛阳小龙朱翔宇孙奇福
申请(专利权)人:北京科技大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1