一种基于客户端行为特征的人机校验模型及方法技术

技术编号:38244773 阅读:11 留言:0更新日期:2023-07-25 18:06
本发明专利技术涉及数据挖掘技术领域,尤其涉及一种基于客户端行为特征的人机校验模型及方法。该方法包括以下步骤:获取客户端行为数据,其中客户端行为数据包括鼠标轨迹数据、键盘输入模式以及页面滚动数据;根据客户端行为数据提取用户行为特征;根据用户行为特征进行用户真实行为识别,从而获得用户行为指数;根据用户行为指数进行阈值判断,从而生成真实用户识别信息,以发送至人机校验模型进行人机校验结果反馈。本发明专利技术通过对客户端行为数据进行深度数据挖掘,提高人机识别的准确性和安全性,防止机器人或恶意程序冒充真实用户进行非法操作。机器人或恶意程序冒充真实用户进行非法操作。机器人或恶意程序冒充真实用户进行非法操作。

【技术实现步骤摘要】
一种基于客户端行为特征的人机校验模型及方法


[0001]本专利技术涉及数据挖掘
,尤其涉及一种基于客户端行为特征的人机校验模型及方法。

技术介绍

[0002]在网络平台开发过程重,平台为了提高流量经常会需要开发一些签到抽奖,领红包等网页应用。这些产品设计的初衷是为了让真实用户参与到活动中,在完成相应的任务后可以获得相应的奖励,然而一些投机者经常会通过脚本程序等方式,利用机器进行的大量的模拟请求,不但会对服务器带来许多负载压力,还会影响到真实用户的正常参与,最终导致线上推广活动质量及口碑的下降,对平台带来诸多不利影响。在现实的应用中,常用的人机校验方式为发送短信验证码或者图片验证码点击,这种方式常常造成对用户使用体验的中断,降低实用性。

技术实现思路

[0003]本专利技术为解决上述技术问题,提出了一种基于客户端行为特征的人机校验模型及方法,以解决至少一个上述技术问题。
[0004]本专利技术提供一种基于客户端行为特征的人机校验方法,包括以下步骤:
[0005]步骤S1:获取客户端行为数据,其中客户端行为数据包括鼠标轨迹数据、键盘输入模式以及页面滚动数据;
[0006]步骤S2:根据客户端行为数据提取用户行为特征;
[0007]步骤S3:根据用户行为特征进行用户真实行为识别,从而获得用户行为指数;
[0008]步骤S4:根据用户行为指数进行阈值判断,从而生成真实用户识别信息,以发送至人机校验模型进行人机校验结果反馈。
[0009]本实施例通过对客户端行为数据进行深度分析,提高人机识别的准确性和安全性,防止机器人或恶意程序冒充真实用户进行非法操作,此外,该方法不需要用户额外输入验证码或者人脸校验,简化了用户操作流程,提高了用户体验。
[0010]在本说明书的一个实施例中,用户行为特征包括鼠标轨迹特征数据以及时序操作特征数据,步骤S2具体为:
[0011]步骤S21:根据客户端行为数据进行最小代价数据清洗,从而获得清洗行为数据;
[0012]步骤S22:根据清洗行为数据进行降维计算,从而获得降维行为数据;
[0013]步骤S23:根据降维行为数据进行归一化计算,从而获得归一化行为数据;
[0014]步骤S24:对归一化行为数据进行鼠标轨迹特征提取以及时序操作特征提取,分别获得鼠标轨迹特征数据以及时序操作特征数据。
[0015]本实施例通过最小代价数据清洗、降维计算以及归一化计算等步骤,可以有效地提高用户行为特征的准确性和可靠性。同时,通过对鼠标轨迹特征数据和时序操作特征数据的提取,可以更全面地反映出用户的真实行为模式,从而提高了人机校验的准确性和安
全性。
[0016]在本说明书的一个实施例中,其中步骤S21具体为:
[0017]步骤S211:根据客户端行为数据进行聚类计算并重合数据合并,从而得到去重复数据;
[0018]步骤S212:根据去重复数据进行标准差计算以及均值计算,从而得到标准差数据以及均值数据;
[0019]步骤S213:基于标准差数据以及均值数据对去重复数据进行异常计算,从而识别去重复数据中的异常数据;
[0020]步骤S214:对异常数据进行异常值删除,从而获得去异常数据;
[0021]步骤S215:根据标准差数据以及均值数据对去异常数据进行缺失值填充,从而生成清洗行为数据。
[0022]本实施例通过聚类计算、标准差计算、均值计算和异常计算等一系列深度数据清洗步骤,可以有效地去除重复数据和异常数据,填充缺失值,从而提高数据质量和准确性,使用了多种数据处理技术和算法,包括聚类计算、标准差计算、均值计算和异常计算,可以优化数据处理流程,通过清洗后的行为数据,可以更加准确地进行数据分析和挖掘,发现潜在的规律和趋势,最小代价为通过聚类计算进行重合度计算,并根据适配数据进行保留计算,降低传统去重复方法中采用随机删除或预设保留方式带来的误差。
[0023]在本说明书的一个实施例中,其中异常计算的步骤具体为:
[0024]步骤S216:根据去重复数据、标准差数据以及均值数据通过异常指数计算公式进行计算,从而生成异常指数;
[0025]步骤S217:判断异常指数是否大于预设的异常指数阈值;
[0026]步骤S218:确定异常指数大于预设的异常指数阈值,则对异常指数相应的去重复数据进行异常标记,从而识别获取去重复数据中的异常数据。
[0027]本实施例通过异常计算步骤,可以根据去重复数据、标准差数据以及均值数据计算异常指数,并对异常指数大于预设阈值的数据进行标记,从而识别异常数据。通过去除异常数据,可以提高数据的准确性和可靠性,通过计算异常指数和设定异常指数阈值,快速地识别和标记异常数据,从而提高数据处理效率和准确性,通过清洗后的数据中的异常数据,可以更加准确地进行数据分析和挖掘,发现潜在的规律和趋势,为企业决策提供更加可靠的支持。
[0028]在本说明书的一个实施例中,异常指数计算公式具体为:
[0029][0030]E为异常数据,α为调整系数,a
i
为第i个去重复数据,为均值数据,o为初始调整值,v为标准差数据,p为误差调整值,u为异常数据的修正值。
[0031]本实施例提供一种异常指数计算公式,该公式充分考虑了调整系数α、第i个去重复数据a
i
、均值数据初始调整值o、标准差数据v、误差调整值p以及相互之间的作用关系,以形成函数关系其中调整系数α根据实际情况调整异常值的权重,提高对于异常值的敏感度或降低对于异常值的敏感度,去重复并计算均值,消除
数据中相同值或者近似值的干扰,确保计算结果更加准确,初始调整值o以针对具体应用场景进行预设,调整判断标准,从而达到更好的异常检测效果,标准差数据v可以根据数据的分布情况进行计算,较大的标准差表示数据分布比较分散,需要更高的异常检测敏感度,误差调整值p适当的增加误差调整值可以避免因为数据波动引起的误判,提高判断准确性,异常数据的修正值u可以通过人工干预的方式对输出结果进行二次修正,确保最终结果更加准确。
[0032]在本说明书的一个实施例中,步骤S2之后步骤S3之前的步骤还包括步骤S2.5,步骤S2.5包括以下步骤:
[0033]步骤S201:获取历史用户行为特征;
[0034]步骤S202:根据历史用户行为特征进行分布情况计算,从而生成历史分布情况数据;
[0035]步骤S203:根据用户行为特征数据进行分布情况计算,从而生成用户分布情况数据;
[0036]步骤S204:根据历史分布情况数据与用户分布情况数据进行比较,从而生成分布情况比较数据;
[0037]步骤S205:判断分布情况比较数据是否小于预设的分布情况比较阈值;
[0038]步骤S206:确定分布情况比较数据小于预设的分布情况比较阈值时,则生成包含存在真实用户的真实用户识别信息,以发送至人机校验模型进行人机校验结果反馈;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于客户端行为特征的人机校验方法,其特征在于,包括以下步骤:步骤S1:获取客户端行为数据,其中客户端行为数据包括鼠标轨迹数据、键盘输入模式以及页面滚动数据;步骤S2:根据客户端行为数据提取用户行为特征;步骤S3:根据用户行为特征进行用户真实行为识别,从而获得用户行为指数;步骤S4:根据用户行为指数进行阈值判断,从而生成真实用户识别信息,以发送至人机校验模型进行人机校验结果反馈。2.根据权利要求1所述的方法,其特征在于,用户行为特征包括鼠标轨迹特征数据以及时序操作特征数据,步骤S2具体为:步骤S21:根据客户端行为数据进行最小代价数据清洗,从而获得清洗行为数据;步骤S22:根据清洗行为数据进行降维计算,从而获得降维行为数据;步骤S23:根据降维行为数据进行归一化计算,从而获得归一化行为数据;步骤S24:对归一化行为数据进行鼠标轨迹特征提取以及时序操作特征提取,分别获得鼠标轨迹特征数据以及时序操作特征数据。3.根据权利要求2所述的方法,其特征在于,其中步骤S21具体为:根据客户端行为数据进行聚类计算并重合数据合并,从而得到去重复数据;根据去重复数据进行标准差计算以及均值计算,从而得到标准差数据以及均值数据;基于标准差数据以及均值数据对去重复数据进行异常计算,从而识别去重复数据中的异常数据;对异常数据进行异常值删除,从而获得去异常数据;根据标准差数据以及均值数据对去异常数据进行缺失值填充,从而生成清洗行为数据。4.根据权利要求3所述的方法,其特征在于,其中异常计算的步骤具体为:根据去重复数据、标准差数据以及均值数据通过异常指数计算公式进行计算,从而生成异常指数;判断异常指数是否大于预设的异常指数阈值;确定异常指数大于预设的异常指数阈值,则对异常指数相应的去重复数据进行异常标记,从而识别获取去重复数据中的异常数据。5.根据权利要求4所述的方法,其特征在于,异常指数计算公式具体为:E为异常数据,α为调整系数,a
i
为第i个去重复数据,为均值数据,o为初始调整值,v为标准差数据,p为误差调整值,u为异常数据的修正值。6.根据权利要求1所述的方法,其特征在于,步骤S2之后步骤S3之前的步骤还包括步骤S2.5,步骤S2.5包括以下步骤:获取历史用户行为特征;根据历史用户行为特征进行分布情况计算,从而生成历史分布情况数据;根据用户行为特征数据进行分布情况计算,从而生成用户分布情况数据;
根据历史分布情况数据与用户分布情况数据进行比较,从而生成分布情况比较数据;判断分布情况比较数据是否小于预设的分布情况比较阈值;确定分布情况比较数据小于预设的分布情况比较...

【专利技术属性】
技术研发人员:万振民
申请(专利权)人:万汇互联深圳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1