暴力破解请求的智能识别方法、装置、电子设备及介质制造方法及图纸

技术编号:34428124 阅读:17 留言:0更新日期:2022-08-06 16:02
本发明专利技术涉及人工智能领域,提供一种暴力破解请求的智能识别方法,首先对样本数据进行初步划分以形成训练集和验证集,并将训练集转换为高斯分布;根据高斯分布的参数对预创建的模型进行训练以形成高斯模型,通过高斯模型获取验证集的高斯分布数据,根据交叉验证参数确定所述高斯模型的阈值以形成概率模型;而后通过概率模型对所获取的请求信息进行识别处理,以确定请求信息的高斯分布数据,并输出请求信息的目标暴力破解几率,若目标暴力破解几率大于预设的几率对比值,则将所请求信息判断为低频暴力破解请求;如此,自动补抓特征关联性,进行的误差分析方法,来捕捉各种异常的可能,能够捕捉到各种不同的异常情况,自动识别欺骗请求。求。求。

【技术实现步骤摘要】
暴力破解请求的智能识别方法、装置、电子设备及介质


[0001]本专利技术涉及人工智能领域,涉及请求数据分析技术,尤其涉及一种暴力破解请求的智能识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]SSH暴力破解是一种对远程登录设备(比如云服务器)的暴力攻击,该攻击会使用各种用户名、密码尝试登录设备,一旦成功登录,便可获得设备权限。近些年,爆破SSH登录密码的开源工具也很强大,如nmap、hydra。出现众多入侵系统手法,如Apache Struts2漏洞利用、Hadoop Yarn REST API未授权漏洞利用,传统的SSH暴力破解攻击手段一直沿用。所以威胁检测产品需对暴力破解攻击有足够的技术识别和防范。目前检测发现方法为通过在云主机上部署脚本python脚本,限制SSH登陆,通过监控系统日志,将超过错误次数的IP放入TCP Wrappers中禁止登陆,但是该方法无法做集中管理,无数据积累,无法做深度分析;另外一种方法通过主机安全Agent统计连接频率(可自定义频率,例如:1分钟内连接30次),冻结连接IP一段时间缓解(可自定义冻结时间,例如:30分钟),但该方法无法全部拦截识别,准确率低;第三种方法通过部署IDS/IPS来辨别禁止暴力破解,但该种方式,深度关联性相对差。
[0003]因此,亟需一种操作简单,准确率高,可关联性强的一种暴力破解请求的智能识别方法。

技术实现思路

[0004]本专利技术提供一种暴力破解请求的智能识别方法,以解决现有技术中的破解方法无法做集中管理,无数据积累,无法做深度分析,无法全部拦截识别,准确率低的问题。
[0005]为实现上述目的,本专利技术提供的一种暴力破解请求的智能识别方法,包括:
[0006]通过外部网络连接数据收集数据集,并对所述数据集进行预处理以形成样本数据;
[0007]对所述样本数据进行初步划分以形成训练集和验证集,并将所述训练集转换为高斯分布;
[0008]根据所述高斯分布的参数对预创建的模型进行训练以形成高斯模型,通过所述高斯模型获取所述验证集的高斯分布数据,根据所述高斯分布数据确定所述验证集的验证暴力破解几率,并根据所述验证暴力破解几率与所述验证集的已知暴力破解判定数据进行对比以获取交叉验证参数,根据所述交叉验证参数确定所述高斯模型的阈值以形成概率模型;
[0009]通过所述概率模型对所获取的请求信息进行识别处理,以确定所述请求信息的高斯分布数据,并基于所述请求信息的高斯分布数据和所述阈值确定所述请求信息的目标暴力破解几率,其中,若所述目标暴力破解几率大于预设的几率对比值,则将所请求信息判断为低频暴力破解请求。
[0010]可选地,通过外部网络连接数据收集的数据集为多维数据或登录日志。
[0011]可选地,对所述多维数据进行预处理以形成样本数据,包括:
[0012]对所述多维数据进行数据清洗以形成五元组数据;其中,所述五元组数据包括源IP地址、源端口、目的IP地址、目的端口和传输层协议;
[0013]基于所述五元组数据建立每个请求的所属用户的外部连接状态;
[0014]对所述外部连接状态进行数据提取以形成状态数据,并将所述状态数据与所述五元组数据作为数据集;
[0015]对所述数据集进行规范化的预处理以形成样本数据。
[0016]可选地,所述对所述样本数据进行初步划分以形成训练集和验证集,包括:
[0017]通过预设的数据读取插件判断所述样本数据为异常数据还是非异常数据;
[0018]将所述异常数据作为验证集;将所述非异常数据作为训练集;
[0019]将所述训练集转换为m*n维训练集;
[0020]将所述m*n维训练集转换为n维高斯分布。
[0021]可选地,所述根据所述高斯分布的参数对预创建的模型进行训练以形成高斯模型,包括:
[0022]对m个高斯分布进行数据分析以获取高斯分布的参数;所述高斯分布的参数至少包括概率密度函数;
[0023]将所述训练集、与所述训练集一一对应的高斯分布的参数输入预创的模型中进行反复学习训练以获取所述训练集在各个维度上的数学期望和方差,基于所述数学期望和方差形成高斯模型。
[0024]可选地,所述通过所述概率模型对所获取的请求信息进行识别处理,以确定所述请求信息的高斯分布数据,并基于所述请求信息的高斯分布数据和所述阈值确定所述请求信息的目标暴力破解几率,若所述目标暴力破解几率大于预设的几率对比值,则将所请求信息判断为低频暴力破解请求,包括:
[0025]将所获取的请求信息输入至所述概率模型;
[0026]通过所述概率模型的前期处理单元对所述请求信息进行数据提取以获取关于所述请求信息的多维数据;
[0027]通过所述概率模型中的高斯模型部分对所述多维数据进行高斯处理以获取所述请求信息的高斯分布数据,并根据所述请求信息的高斯分布数据和所述阈值判断所述请求信息的目标暴力破解几率;
[0028]将所述目标暴力破解几率与预设的几率对比值相比对,若所述目标暴力破解几率大于预设的几率对比值,则将所述请求信息判断为低频暴力破解请求;若所述目标暴力破解几率不大于预设的几率对比值,则将所述请求信息判断为非低频暴力破解请求;
[0029]若所述请求信息为低频暴力破解请求,则禁止与所述请求信息对应的用户请求登录。
[0030]可选地,所述判断所述请求信息的目标暴力破解几率,包括:
[0031]对所述多维数据进行遍历分析以获取概率判断基数;
[0032]根据所述多维数据获取用户外部链接数据与用户连接SSH端口的连接计数,以及用户连接SSH端口的月平均值,并按照预设规则基于所述判断基数、所述月平均值与所述连
接计数的差值,将所述差值作为辅助信息计算暴力破解几率。
[0033]为了解决上述问题,本专利技术还提供一种暴力破解请求的智能识别装置,所述装置包括:
[0034]数据处理单元,用于通过外部网络连接数据收集数据集,并对所述数据集进行预处理以形成样本数据;
[0035]数据划分单元,用于对所述样本数据进行初步划分以形成训练集和验证集,并将所述训练集转换为高斯分布;
[0036]模型训练单元,用于根据所述高斯分布的参数对预创建的模型进行训练以形成高斯模型,通过所述高斯模型获取所述验证集的高斯分布数据,根据所述高斯分布数据确定所述验证集的验证暴力破解几率,并根据所述验证暴力破解几率与所述验证集的已知暴力破解判定数据进行对比以获取交叉验证参数,根据所述交叉验证参数确定所述高斯模型的阈值以形成概率模型;
[0037]请求处理单元,用于通过所述概率模型对所获取的请求信息进行识别处理,以确定所述请求信息的高斯分布数据,并基于所述请求信息的高斯分布数据和所述阈值确定所述请求信息的目标暴力破解几率,若所述目标暴力破解几率大于预设的几率对比值,则将所请求信息判断为低频暴力破解请求。
[0038]为了解决上述问本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种暴力破解请求的智能识别方法,其特征在于,包括:通过外部网络连接数据收集数据集,并对所述数据集进行预处理以形成样本数据;对所述样本数据进行初步划分以形成训练集和验证集,并将所述训练集转换为高斯分布;根据所述高斯分布的参数对预创建的模型进行训练以形成高斯模型,通过所述高斯模型获取所述验证集的高斯分布数据,根据所述高斯分布数据确定所述验证集的验证暴力破解几率,并根据所述验证暴力破解几率与所述验证集的已知暴力破解判定数据进行对比以获取交叉验证参数,根据所述交叉验证参数确定所述高斯模型的阈值以形成概率模型;通过所述概率模型对所获取的请求信息进行识别处理,以确定所述请求信息的高斯分布数据,并基于所述请求信息的高斯分布数据和所述阈值确定所述请求信息的目标暴力破解几率,其中,若所述目标暴力破解几率大于预设的几率对比值,则将所请求信息判断为低频暴力破解请求。2.如权利要求1所述的暴力破解请求的智能识别方法,其特征在于,通过外部网络连接数据收集的数据集为多维数据或登录日志。3.如权利要求2所述的暴力破解请求的智能识别方法,其特征在于,对所述多维数据进行预处理以形成样本数据,包括:对所述多维数据进行数据清洗以形成五元组数据;其中,所述五元组数据包括源IP地址、源端口、目的IP地址、目的端口和传输层协议;基于所述五元组数据建立每个请求的所属用户的外部连接状态;对所述外部连接状态进行数据提取以形成状态数据,并将所述状态数据与所述五元组数据作为数据集;对所述数据集进行规范化的预处理以形成样本数据。4.如权利要求2所述的暴力破解请求的智能识别方法,其特征在于,所述对所述样本数据进行初步划分以形成训练集和验证集,包括:通过预设的数据读取插件判断所述样本数据为异常数据还是非异常数据;将所述异常数据作为验证集;将所述非异常数据作为训练集;将所述训练集转换为m*n维训练集;将所述m*n维训练集转换为n维高斯分布。5.如权利要求1所述的暴力破解请求的智能识别方法,其特征在于,所述根据所述高斯分布的参数对预创建的模型进行训练以形成高斯模型,包括:对m个高斯分布进行数据分析以获取高斯分布的参数;所述高斯分布的参数至少包括概率密度函数;将所述训练集、与所述训练集一一对应的高斯分布的参数输入预创的模型中进行反复学习训练以获取所述训练集在各个维度上的数学期望和方差,基于所述数学期望和方差形成高斯模型。6.如权利要求5所述的暴力破解请求的智能识别方法,其特征在于,所述通过所述概率模型对所获取的请求信息进行识别处理,以确定所述请求信息的高斯分布数据,并基于所述请求信息的高斯分布数据和所述阈值确定所述请求信息的目标暴力破解几率,若所述目标暴力破解几率大于预设的几率对比值,则将所请求信息判断为低频暴...

【专利技术属性】
技术研发人员:杜娥
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1