This specification embodiment provides an URL exception location method, which is made up of a packet made up of a number of examples by the URL, and predicts the exception example by the URL exception location model, thus locating the exception field in the URL. URL anomaly location based on multi instance learning can better predict potential threats that are not found in the data.
【技术实现步骤摘要】
URL异常定位方法、装置、服务器及存储介质
本说明书实施例涉及互联网
,尤其涉及一种URL异常定位方法、装置、服务器及存储介质。
技术介绍
在互联网的应用场景中,每天会有大量的对于网址URL(UniformResourceLocator,统一资源定位符)的访问;与此同时,不乏不法分子试图通过不合法的URL访问进行攻击。
技术实现思路
本说明书实施例提供及一种URL异常定位方法、装置、服务器及存储介质。第一方面,本说明书实施例提供一种URL异常定位方法,包括:对URL进行字段切分,得到由对应各个字段的各个示例组成的多示例包;将所述多示例包输入基于多示例学习的URL异常定位模型进行异常示例预测;根据异常示例定位出对应的异常字段。第二方面,本说明书实施例提供一种URL异常定位训练方法,包括:收集由多个URL样本组成的URL样本集;对URL样本集中各个URL样本进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包;集合各个URL样本的多示例包得到多示例包集;基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练;基于所述分类训练,得到所述URL异常定位模型。第三方面,本说明书实施例提供一种URL异常定位装置,包括:切分单元,用于对URL进行字段切分,得到由对应各个字段的各个示例组成的多示例包;预测单元,用于将所述多示例包输入基于多示例学习的URL异常定位模型进行异常示例预测;定位单元,用于根据异常示例定位出对应的异常字段。第四方面,本说明书实施例提供一种URL异常定位训练装置,包括:样本获取单元,用于收集由多个URL样本组成的UR ...
【技术保护点】
1.一种URL异常定位方法,包括:对URL进行字段切分,得到由对应各个字段的各个示例组成的多示例包;将所述多示例包输入基于多示例学习的URL异常定位模型进行异常示例预测;根据异常示例定位出对应的异常字段。
【技术特征摘要】
1.一种URL异常定位方法,包括:对URL进行字段切分,得到由对应各个字段的各个示例组成的多示例包;将所述多示例包输入基于多示例学习的URL异常定位模型进行异常示例预测;根据异常示例定位出对应的异常字段。2.根据权利要求1所述的方法,还包括:基于多示例学习算法对多个URL样本进行训练,得到所述URL异常定位模型。3.根据权利要求2所述的方法,所述基于多示例学习算法对多个URL样本进行训练,得到所述URL异常定位模型,包括:对URL样本集中各个URL样本进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包;集合各个URL样本的多示例包得到多示例包集;基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练;基于所述分类训练,得到所述URL异常定位模型。4.根据权利要求3所述的方法,所述异常示例和非异常示例通过示例的异常标记的值进行区分;所述对多示例包集进行异常示例及非异常示例分类训练包括:对多示例包集中每个示例的异常标记的值进行初始化,并对异常标记的值进行迭代学习,更新调整出每个示例最终的异常标记的值。5.根据权利要求4所述的方法,所述将所述多示例包输入预设的URL异常定位模型进行异常示例预测包括:根据所述URL异常定位模型,预测所述多示例包中的各个示例的异常标记的值,从而预测所述多示例包中的各个示例是否为异常示例。6.根据权利要求1-5任一项所述的方法,还包括:确定所述URL是否为异常URL:如果所述URL对应的示例包中包括异常示例,则确定所述URL为异常URL;如果所述URL对应的示例包中不包括异常示例,则确定所述URL为非异常URL。7.根据权利要求1-5任一项所述的方法,所述示例是由对应字段的特征向量表示的。8.根据权利要求1-5任一项所述的方法,所述字段为URL中参数请求字段。9.一种URL异常定位训练方法,包括:收集由多个URL样本组成的URL样本集;对URL样本集中各个URL样本进行字段切分,针对每个URL样本得到由对应各个字段的各个示例组成的多示例包;集合各个URL样本的多示例包得到多示例包集;基于多示例学习算法,对多示例包集进行异常示例及非异常示例分类训练;基于所述分类训练,得到所述URL异常定位模型。10.根据权利要求9所述的方法,所述异常示例和非异常示例通过示例的异常标记的值进行区分;所述对多示例包集进行异常示例及非异常示例分类训练包括:对多示例包集中每个示例的异常标记的值进行初始化,并对异常标记的值进行迭代学习,更新调整出每个示例最终的异常标记的值。11.一种URL异常定位装置,包括:切分单元,用于对URL进行字段切分,得到由对应各个字段的各个示例组成的多示例包;预测单元,用于将所述多示例包输入基...
【专利技术属性】
技术研发人员:张雅淋,李龙飞,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。