网页文件解析方法、装置、设备和存储介质制造方法及图纸

技术编号:43142703 阅读:19 留言:0更新日期:2024-10-29 17:45
本发明专利技术实施例提供一种网页文件解析方法、装置、设备和存储介质,该方法包括:接收网页文件,网页文件中包括网络资源以及网络资源对应的地址信息;对网页文件进行初次解析处理;若解析失败,则将网页文件由原编码格式转换为目标编码格式,对转换后的网页文件进行解析处理;对解析后的网页文件中的地址信息进行重写,以使得重写后的地址信息指向与网络资源对应的安全访问网页。采用本发明专利技术,不管网页文件采用的是什么类型的编码格式进行编码的,都先直接进行初次解析处理,如果发现解析失败,则再将网页文件由原编码格式转换为目标编码格式。可以在拥有整体较高网页文件解析效率的情况下实现网页文件的解析。

【技术实现步骤摘要】

本专利技术涉及网络安全,尤其涉及一种网页文件解析方法、装置、设备和存储介质


技术介绍

1、相关技术中,当客户端请求企业内部服务器中的网络资源时,服务器会将网络资源携带在网页文件中发送至安全代理设备,由安全代理设备对网页文件进行相关处理再转发给客户端,这样可以屏蔽客户端对服务器的直接访问,保证了服务器的安全性。在安全代理设备对网页文件进行相关处理之前,首先需要对网页文件进行解析处理,这样安全代理设备才能正常地对解析后的网页文件进行相关处理。而在解析的过程中,只有网页文件是采用预设编码格式进行编码的情况下才能正常地进行解析处理,如果网页文件未采用预设编码格式进行编码则会发生解析失败的情况,导致安全代理设备后续无法正常对网页文件进行相关处理,进而阻碍了客户端的访问,产生业务不连续的情况。


技术实现思路

1、本专利技术实施例提供一种网页文件解析方法、装置、设备和存储介质,用以实现对网页文件成功解析,并且实现在较高的处理效率下完成对网页文件的解析。

2、第一方面,本专利技术实施例提供一种网页文件解析方法,本文档来自技高网...

【技术保护点】

1.一种网页文件解析方法,其特征在于,应用于安全代理设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在对所述网页文件进行初次解析处理之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述网页文件进行初次解析处理,包括:

4.根据权利要求3所述的方法,其特征在于,所述解析单位包括所述网页文件整体、单个字符或者单个文件块。

5.根据权利要求1所述的方法,其特征在于,所述若解析失败,则将所述网页文件由原编码格式转换为目标编码格式,包括:

6.根据权利要求1所述的方法,其特征在于,所述目标编码格式包...

【技术特征摘要】

1.一种网页文件解析方法,其特征在于,应用于安全代理设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在对所述网页文件进行初次解析处理之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述网页文件进行初次解析处理,包括:

4.根据权利要求3所述的方法,其特征在于,所述解析单位包括所述网页文件整体、单个字符或者单个文件块。

5.根据权利要求1所述的方法,其特征在于,所述若解析失败,则将所述网页文件由原编码格式转换为目标编码格式,包括:

6.根据权利要求1所述的方法,其特征在于,所述目标编码格式包括宽字节编码格式和/或特定字符编码格式,所述特定字符编码格式包括utf-8字符编码格...

【专利技术属性】
技术研发人员:王子瑜郑凤顺张庆勇
申请(专利权)人:北京华耀科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1