一种非法用户名的识别方法和系统技术方案

技术编号:15334624 阅读:62 留言:0更新日期:2017-05-16 21:48
本发明专利技术实施例提供了一种非法用户名的识别方法和系统,该识别方法和系统应用于网络服务器,具体为当某个用户输入用户名时,获取该用户名,该用户名中包括字符串;利用预设的基于逻辑斯特回归模型的字符串识别模型对用户名进行识别,得到用户名的置信度指标;当置信度指标低于预设的置信度阈值时,将该用户名判定为非法用户名。在确定输入的用户名是非法用户后,即可阻止其恶意注册,从而保证了网络的安全性。

【技术实现步骤摘要】
一种非法用户名的识别方法和系统
本专利技术涉及信息安全领域,特别是涉及一种非法用户名的识别方法和系统。
技术介绍
随着信息技术的发展,互联网已经成为一种不可或缺的重要工具,在人们日常的工作、生活中发挥着越来越重要的作用。人们通过互联网进行游戏、收发信息、网上交易、获得服务等,以上这些活动的一个最基本要求是具有一个确认用户身份的用户名。广义上的用户名包括网银账号、邮箱号码、游戏账号、微信账号、论坛账号等。为了使用方便,人们一般会利用或长或短的字符串作为用户名,以便于记忆和输入。随着人们对互联网的依赖,网络安全也成为互联网服务者必须予以重视的重要方面,必须能够防止非法用户的侵入,从而避免用户的信息发生泄漏。目前,一些不法分子会利用机器生成众多的用户名进行恶意注册,意图侵入网络窃取信息或进行其他的违法活动,因此防止恶意注册成为保证互联网安全的一项重要措施。
技术实现思路
有鉴于此,本专利技术提供了一种非法用户名的识别方法和系统,以便网络服务器在识别出非法用户名的基础上能够阻止其恶意注册,从而保证网络的安全性。为了解决上述问题,本专利技术实施例公开了一种非法用户名的识别方法,应用于网络服务器,包括如下步骤:获取用户输入的用户名,所述用户名中包括字符串;利用预设的基于逻辑斯特回归模型的字符串识别模型对所述用户名进行处理,得到所述用户名的置信度指标;当所述置信度指标低于预设的置信度阈值时,将所述用户名判定为非法用户名。可选的,字符串识别模型通过如下步骤获取:获取多个字符串样本;提取所述字符串样本的字符串特征;利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型。可选的,所述字符串特征包括:所述字符串样本的熵;预选的特征字符在所述字符串样本中出现的次数和概率;所述特征字符最大连续长度;任意两种所述特征字符在所述字符串样本中出现次数的比率;任意两种所述特征字符在所述字符串样本中相互切换的次数和比例;和/或,任意所述特征字符在所述字符串样本中相互切换的次数和比例。可选的,所述特征字符为所述字符串样本中的小写字母、大写字母、数字和特殊字符中的部分或全部。可选的,所述利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型,包括:利用所述字符串特征对所述逻辑斯特回归模型进行训练;在训练过程中对所述逻辑斯特回归模型进行交叉验证和参数调优,得到所述字符串识别模型。相应的,为了保证上述方法的实施,本专利技术还提供了一种非法用户名的识别系统,应用于网络服务器,包括:用户名获取模块,用于获取用户输入的用户名,所述用户名中包括字符串;置信度计算模块,用于利用预设的基于逻辑斯特回归模型的字符串识别模型对所述用户名进行处理,得到所述用户名的置信度指标;用户名判定模块,用于当所述置信度指标低于预设的置信度阈值时,将所述用户名判定为非法用户名。可选的,还包括模型训练模块,所述模型训练模块包括:样本获取单元,用于获取多个字符串样本;特征提取单元,用于提取所述字符串样本的字符串特征;模型训练单元,用于利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型。可选的,所述字符串特征包括:所述字符串样本的熵;预选的特征字符在所述字符串样本中出现的次数和概率;所述特征字符最大连续长度;任意两种所述特征字符在所述字符串样本中出现次数的比率;任意两种所述特征字符在所述字符串样本中相互切换的次数和比例;和/或,任意所述特征字符在所述字符串样本中相互切换的次数和比例。可选的,所述特征字符为所述字符串样本中的小写字母、大写字母、数字和特殊字符中的部分或全部。可选的,所述模型训练单元包括:第一训练子单元,用于利用所述字符串特征对所述逻辑斯特回归模型进行训练;第二训练子单元,用于在训练过程中对所述逻辑斯特回归模型进行交叉验证和参数调优,得到所述字符串识别模型。从上述技术方案可以看出,本专利技术实施例提供了一种非法用户名的识别方法和系统,该识别方法和系统应用于网络服务器,具体为当某个用户输入用户名时,获取该用户名,该用户名中包括字符串;利用预设的基于逻辑斯特回归模型的字符串识别模型对用户名进行识别,得到用户名的置信度指标;当置信度指标低于预设的置信度阈值时,将该用户名判定为非法用户名。在确定输入的用户名是非法用户后,即可阻止其恶意注册,从而保证了网络的安全性。本专利技术着重于解决对用户名中字符串的识别问题,即对用户名字符串进行合法性识别,以此避免非法用户的恶意注册。附图说明图1为本专利技术实施例的一种非法用户名的识别方法的步骤流程图;图2为本专利技术实施例的一种字符串识别模型的获取方法的步骤流程图;图3为本专利技术实施例的一种非法用户名的识别系统的结构框图;图4为本专利技术实施例的另一种非法用户名的识别系统的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一般来说,合法用户在设置相应用户名时,其所使用的字符串会有一定的实际意义,例如真实名字、公司名称、生日或其他日期、动植物名称或地名等,而非法用户名由于是利用机器随机生成,因此一般不会具有上述特征,本专利技术就是基于以上原理对非法用户名进行识别,具体的实施例如下。实施例一图1为本专利技术实施例的一种非法用户名的识别方法的步骤流程图。参照图1所示,本实施例提供的非法用户名的识别方法应用于网络服务器,用于使网络服务免于有人采用无意义的非法用户名恶意注册导致网络安全问题,具体的识别方法包括如下步骤:S101:获取用户输入的用户名。在网络服务器接收到用户意图进行注册而输入的用户名和对应的密码后,获取该用户名,一般来说,该用户名中会包含有字符串。该用户名为网银账号、邮箱号码、游戏账号、微信账号、论坛账号等,以分别用于登录网上银行、邮箱、游戏、微信和论坛。S102:对用户名进行处理,得到该用户名的置信度指标。在对用户名进行识别时,本实施例是利用预设的基于逻辑斯特回归模型的字符串识别模型对该用户名进行识别,即利用该字符串识别模型对用户名中的字符串进行识别,识别其中的字符串是否包含相应的含义,通过这种方法识别该用户名的置信度指标。置信度是指用户名可以被信任的程度,因此该置信度指标反映当前被识别的用户名的量化的置信度。以一定的判断指标对置信度指标进行判断即可确定该用户名是否为合法用户名。所谓合法用户名是指上述的用户名中的字符串具有一定的实际意义,而并不是随机伪造的。该字符串识别模型来自于逻辑斯特回归模型,是利用提前获取到的多个字符串样本对该逻辑斯特回归模型进行训练后得到的。逻辑斯特回归模型是机器学习中的一种分类模型,由于算法简单和高效,在实际中应用非常广泛。逻辑斯特回归模型本身和求解相对都比较简洁,实现也相对简单。通过对特征做离散化和其他映射,逻辑斯特回归模型也可以处理非线性问题,是一个非常强大的分类器。因此在实际应用中,能够利用拿到的多个低层次的特征解决相应的问题。S103:判断用户名是否为非法用户名。在得到用户名的置信度指标后,即可对于该置信度指标按一定的判断标识进行判断,例如可以预本文档来自技高网...
一种非法用户名的识别方法和系统

【技术保护点】
一种非法用户名的识别方法,应用于网络服务器,其特征在于,包括如下步骤:获取用户输入的用户名,所述用户名中包括字符串;利用预设的基于逻辑斯特回归模型的字符串识别模型对所述用户名进行处理,得到所述用户名的置信度指标;当所述置信度指标低于预设的置信度阈值时,将所述用户名判定为非法用户名。

【技术特征摘要】
1.一种非法用户名的识别方法,应用于网络服务器,其特征在于,包括如下步骤:获取用户输入的用户名,所述用户名中包括字符串;利用预设的基于逻辑斯特回归模型的字符串识别模型对所述用户名进行处理,得到所述用户名的置信度指标;当所述置信度指标低于预设的置信度阈值时,将所述用户名判定为非法用户名。2.如权利要求1所述的识别方法,其特征在于,字符串识别模型通过如下步骤获取:获取多个字符串样本;提取所述字符串样本的字符串特征;利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型。3.如权利要求2所述的识别方法,其特征在于,所述字符串特征包括:所述字符串样本的熵;预选的特征字符在所述字符串样本中出现的次数和概率;所述特征字符最大连续长度;任意两种所述特征字符在所述字符串样本中出现次数的比率;任意两种所述特征字符在所述字符串样本中相互切换的次数和比例;和/或,任意所述特征字符在所述字符串样本中相互切换的次数和比例。4.如权利要求3所述的识别方法,其特征在于,所述特征字符为所述字符串样本中的小写字母、大写字母、数字和特殊字符中的部分或全部。5.如权利要求2所述的识别方法,其特征在于,所述利用所述字符串特征对预设的逻辑斯特回归模型进行训练,得到所述字符串识别模型,包括:利用所述字符串特征对所述逻辑斯特回归模型进行训练;在训练过程中对所述逻辑斯特回归模型进行交叉验证和参数调优,得到所述字符串识别模型。6.一种非法用户名的识别系统,应用于网络服务器...

【专利技术属性】
技术研发人员:宗志远
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1