本发明专利技术提供了一种用于反欺诈的人机识别系统,涉及注册,登陆,秒杀,订单,抽奖,价格信息(爬虫)等业务领域,该系统采用了前端采集器,在前端搜集环境、用户行为、HTTP请求信息等,并在服务端建模分析打分,识别机器。人机识别的结果可以提供风控拦截或者其他挑战行为(如验证码),从而保护用户的账号安全。欲保护的点包括前端采集器的设计和实现,前端采集器的安全保护,以及前端采集信息的规则模型等。目前人机识别技术在前端采集信息不丰富,而且缺少前端安全保护,分析数据以规则为主。而该人机识别系统可以很好的弥补现有人机识别前端采集的不足,且加入了安全保护和加强了安全分析的能力。
A man machine identification system for anti fraud
【技术实现步骤摘要】
一种用于反欺诈的人机识别系统
本专利技术涉及业务安全反欺诈领域,特别涉及一种用于反欺诈的人机识别系统。
技术介绍
在反欺诈领域,人机识别是对抗欺诈的有效技术。人机识别的目的是能够在不同用户访问互联网业务时,分析出是否使用机器。现有的技术主要依赖规则判断,而且分析的数据维度比较单一。现有的技术仅仅通过后端分析出结果,往往结果不准确且不可解释。例如同一IP来源的高频访问,有可能是黑产的机器行为,也有可能是大内网的正常用户请求。此外,一些用于分析的数据很容易被黑产伪造,例如IP,UA,设备指纹等。例如黑产可以通过代理IP使得每次访问的IP都不同,从而绕过IP高频访问账户即为黑产账户。
技术实现思路
本专利技术所要解决的技术问题是提供一种用于反欺诈的人机识别系统,通过前端采集必要的数据,后端分析得到是否是人还是机器的结论。为实现上述目的,本专利技术提供一种用于反欺诈的人机识别系统,所述人机识别系统采用了前端采集器,在前端搜集环境、用户行为、HTTP请求信息等,并在服务端建模分析打分,识别机器。所述系统包括环境信息采集模块、用户行为采集模块和机器识别模块;所述环境信息采集模块用于环境检测,包括Selenium操作浏览器分析,脚本工具分析,模拟器分析,以及Debug工具分析;所述用户行为采集模块,用于,采集鼠标、键盘和触摸屏的行为,并采用贝叶斯机器学习进行建模,给规则赋权重,最终给出风险值;所述机器识别模块,根据风险值以及业务场景,给出是否机器的判断结果。所述环境信息采集模块根据从PC的浏览器或者手机App采集的环境信息,判断用户行为是否在模拟器或者Selenium上运行的。所述判断用户行为是否在模拟器上运行的,具体包括:如果满足以下条件之一,则判断用户行为是在模拟器上运行的:检查手机IMEI编号,包括获取IMEI号,获取本机号码,获取SIM卡的序号,得到用户Id,判断是否为空,如果为空,则判断用户行为是在模拟器上运行的;读取手机品牌信息,包括品牌,厂商,以及型号,判断是否为空,如果为空,则判断用户行为是在模拟器上运行的;检查CPU信息是否为空,如果为空,则判断用户行为是在模拟器上运行的;检查Mac地址是否为空,如果为空,则判断用户行为是在模拟器上运行的;通过电池信息检查电池信息是否没有变化,如果没有变化,则判断用户行为是在模拟器上运行的;检查基带信息是否为空,如果为空,则判断用户行为是在模拟器上运行的;判断处理器信息ro.product.board和ro.board.platform是否有冲突或者不一致,如果有,则判断用户行为是在模拟器上运行的;判断能否读取到控制组信息(如ro.build.flavor),如果不能,则判断用户行为是在模拟器上运行的;判断能否读取到进程组信息(位置为/proc/self/cgroup),如果不能,则判断用户行为是在模拟器上运行的;判断wlan驱动是否未知指定异常(例如“wlan0Linkencap:UNSPEC”),如果是,则判断用户行为是在模拟器上运行的;判断是否常出现未指定网卡类型的情况,如果是,则判断用户行为是在模拟器上运行的;比如,连上wifi但会出现Linkencap:UNSPEC未指定网卡类型情况;判断传感器数量是否为1,如果是,则判断用户行为是在模拟器上运行的;判断hardware是否是ttVM(天天模拟器),如果是,则判断用户行为是在模拟器上运行的,Hardware(硬件)是计算机系统的一个组成部分,比如显示器、主板、CPU、内存、各种插卡等这些都称为Hardware;判断用户预装app是否小于5,如果是,则判断用户行为是在模拟器上运行的。所述判断用户行为是否在Selenium上运行的,具体包括:如果UA字段包含WebDriver的特征(特征包括Phantomjs,Selenium),则判断用户行为是在Selenium上运行的。所述环境信息采集模块根据Httprequest的header中的字段UA,以及从HTML页面采集的DOM,综合分析是否是机器行为。如果字段UA为空或者包含WebDriver的特征(特征包括Phantomjs,Selenium),或者DOM为空,则判定是机器人操作,即机器行为。所述鼠标、键盘和触摸屏的行为包括用户的鼠标,键盘,触摸屏的坐标,以及移动事件,移动事件包括事件名称和事件说明,具体如下表1所示:表1所述用户行为采集模块根据如下三个行为规则来判定一个账号是否是机器人账号:一是频率规则,如果一个账号在操作页面时没有鼠标,键盘,或者触摸屏的操作,或者键盘,鼠标,触摸屏点击频率大于自然人的阈值,阀值是5次/秒,则判定是机器人操作;二是完整性规则,如果搜集的数据缺失,则判定是机器人操作。搜集的数据包括环境信息采集模块获取的浏览器或App的UA,DOM信息,以及用户行为采集模块获取的鼠标,键盘和触摸屏的行为;三是其他规则,如果是IP代理,或者键盘,鼠标,触摸屏的速度大于正常人,则判定是机器人操作。所述机器识别模块根据环境信息采集模块和用户行为采集模块采集的数据,并用贝叶斯模型给三个行为规则设置不同的权重,最终得到0-100的风险值,并根据风险值和业务场景判断是否是机器人操作,如下是朴素贝叶斯公式,其中m=3:其中,x是指机器人的判定,yi是指第i个特征,P(yi)是指第i个特征yi行为规则为真的概率;P(x|yi)是指在第i个特征yi行为规则为真的前提下,,是机器人的条件概率;P(x|yi)P(yi)是指第i个特征yi行为规则为真且yi为真前提下机器人的概率;所述三个行为规则的风险值分别是P(y1)、P(y2)、P(y3),三个行为规则的权重分别是根据贝叶斯模型计算出的a1、a2、a3,风险值是P(x)*100,P(x)的取值区间是[0,1],i取值为1、2、3。业务场景是指互联网页面功能,包括注册,登陆,找回密码。最终弹出验证码(可以是图片,语音,滑动验证码)。所述验证码是所接业务方提供,非本专利技术的保护内容。本专利技术创新点主要是利用环境检测和行为分析来检测机器行为。(1)利用环境监测发现运行在异常环境下的机器行为;(2)利用用户行为分析检测机器行为。前端采集主要有如下步骤:1、向后端请求token;2、初始化本地加密密钥和方法;3、获取收集的加密数据;4、将加密数据传给后端;后端分析主要有如下步骤:(1)解密加密数据;(2)判断数据的完整性,有效性;(3)分析数据,判断是否是机器人;(4)根据分析的结果,作出相应的业务处理,比如拒绝、验证码校验、短信校验等;优选的,所述向后端获得token,并且插入到用户浏览器的cookie里。作为状态标识,token无法伪造,且唯一。优选的,所述初始本文档来自技高网...
【技术保护点】
1.一种用于反欺诈的人机识别系统,其特征在于,包括环境信息采集模块、用户行为采集模块和机器识别模块;/n所述环境信息采集模块用于环境检测,包括Selenium操作浏览器分析,脚本工具分析,模拟器分析,以及Debug工具分析;/n所述用户行为采集模块,用于,采集鼠标、键盘和触摸屏的行为,并采用贝叶斯机器学习进行建模,给规则赋权重,最终给出风险值;/n所述机器识别模块,根据风险值以及业务场景,给出是否机器的判断结果。/n
【技术特征摘要】
1.一种用于反欺诈的人机识别系统,其特征在于,包括环境信息采集模块、用户行为采集模块和机器识别模块;
所述环境信息采集模块用于环境检测,包括Selenium操作浏览器分析,脚本工具分析,模拟器分析,以及Debug工具分析;
所述用户行为采集模块,用于,采集鼠标、键盘和触摸屏的行为,并采用贝叶斯机器学习进行建模,给规则赋权重,最终给出风险值;
所述机器识别模块,根据风险值以及业务场景,给出是否机器的判断结果。
2.根据权利要求1所述的系统,其特征在于,所述环境信息采集模块根据从PC的浏览器或者手机App采集的环境信息,判断用户行为是否在模拟器或者Selenium上运行的。
3.根据权利要求2所述的系统,其特征在于,所述判断用户行为是否在模拟器上运行的,具体包括:
如果满足以下条件之一,则判断用户行为是在模拟器上运行的:
检查手机IMEI编号,包括获取IMEI号,获取本机号码,获取SIM卡的序号,得到用户Id,判断是否为空,如果为空,则判断用户行为是在模拟器上运行的;
读取手机品牌信息,包括品牌,厂商,以及型号,判断是否为空,如果为空,则判断用户行为是在模拟器上运行的;
检查CPU信息是否为空,如果为空,则判断用户行为是在模拟器上运行的;
检查Mac地址是否为空,如果为空,则判断用户行为是在模拟器上运行的;
通过电池信息检查电池信息是否没有变化,如果没有变化,则判断用户行为是在模拟器上运行的;
检查基带信息是否为空,如果为空,则判断用户行为是在模拟器上运行的;
判断处理器信息ro.product.board和ro.board.platform是否有冲突或者不一致,如果有,则判断用户行为是在模拟器上运行的;
判断能否读取到控制组信息,如果不能,则判断用户行为是在模拟器上运行的;
判断能否读取到进程组信息,如果不能,则判断用户行为是在模拟器上运行的;
判断wlan驱动是否未知指定异常,如果是,则判断用户行为是在模拟器上运行的;
判断是否常出现未指定网卡类型的情况,如果是,则判断用户行为是在模拟器上运行的;
判断传感器数量是否为1,如果是,则判断用户行为是在模拟器上运行的;
判断hardware是否是ttVM,如果是,则判断用户行为是在模拟器上运行的;
...
【专利技术属性】
技术研发人员:陈平,
申请(专利权)人:南京安璟信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。