一种URL检测模型的训练方法、装置、设备及介质制造方法及图纸

技术编号:40508722 阅读:13 留言:0更新日期:2024-03-01 13:23
本申请涉及网络安全技术领域,尤其涉及一种URL检测模型的训练方法、装置、设备及介质。每次迭代训练时,在训练集中获取第一预设数量的第一样本URL,初始检测模型的第一子模型确定第一概率,第二子模型确定第二概率;根据第一概率以及预设阈值确定第一伪标签,并根据第一伪标签以及第二概率确定第一损失值;根据第二概率以及预设阈值确定第二伪标签,并根据第二伪标签以及第一概率确定第二损失值;根据第一样本URL分别对应的第一损失值和第二损失值,对第一子模型的参数调整,根据调整后的第一子模型中的参数对第二子模型的参数调整,实现了使用无标签的样本数据对初始URL检测模型进行训练,有效的提高了模型训练的效率。

【技术实现步骤摘要】

本申请涉及网络安全,尤其涉及一种url检测模型的训练方法、装置、设备及介质。


技术介绍

1、随着当前信息技术的高速发展,各行各业都不得不面对网络安全隐患问题。当用户接入网络访问不明统一资源定位器(uniform resource locator,url)或伪装为正常的恶意url时,可能就会进入网络攻击者的陷阱,导致个人信息的泄露甚至财产损失。因此,如何高效准确地检测用户访问的url是否安全,避免用户访问恶意url成为一个研究热点。

2、相关技术中,通常是使用预先训练完成的url检测模型对待检测url进行检测,从而确定该待检测url是否为恶意url。传统的url检测模型的训练过程,一般是预先标注大量的训练数据,再使用该大量的训练数据对初始url检测模型进行训练。但是,恶意url的生成速度非常快,这就意味着需要经常对url检测模型重新进行训练,以保证url检测模型能准确识别恶意url。而收集和标注训练数据是非常耗时的,从而导致每次对url检测模型重新进行训练的效率极低。

3、因此,如何提高url检测模型的训练效率成为亟待解决的问题。...

【技术保护点】

1.一种URL检测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将该第一样本URL输入到所述初始检测模型中之前,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述将该第一样本URL输入到所述初始检测模型中之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述第一预设数量的第一样本URL分别对应的第一损失值和第二损失值,对所述第一子模型中的参数进行调整包括:

5.根据权利要求1或4所述的方法,其特征在于,所述训练集中还包括第二样本URL及对应的标签,所述标签...

【技术特征摘要】

1.一种url检测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将该第一样本url输入到所述初始检测模型中之前,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述将该第一样本url输入到所述初始检测模型中之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述第一预设数量的第一样本url分别对应的第一损失值和第二损失值,对所述第一子模型中的参数进行调整包括:

5.根据权利要求1或4所述的方法,其特征在于,所述训练集中还包括第二样本url及对应的标签,所述标签用于标识对应的第二样本url是否为恶意url的概率;每次迭代训练时还执行如下步骤:

6.根据权利要求5所述的方法,其特征在于,所述确定所述第一子...

【专利技术属性】
技术研发人员:苏卓李洋洋胡任贤张怡文张傲
申请(专利权)人:天翼安全科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1