网站数据的保存方法及装置制造方法及图纸

技术编号:30832053 阅读:58 留言:0更新日期:2021-11-18 12:48
本发明专利技术公开了一种网站数据的保存方法及装置,用以解决保存的网页在断网条件下或外网环境中打开时页面渲染失败或不完整的问题。该方法包括:根据目标网站的登录信息,获取与目标网站的首页页面相关联的第一页面资源;对第一页面资源进行处理,根据第一处理结果生成第一页面访问包;获取目标网站中包含的页面链接,根据页面链接获取与目标网站的非首页页面相关联的第二页面资源;对第二页面资源进行处理,根据第二处理结果生成第二页面访问包;根据第一页面访问包以及第二页面访问包,生成用于保存网站数据的网站数据访问包。该方式保存的网页在断网条件下或外网环境中打开时,能够通过访问包获取到需经内网获取的数据,实现页面完整渲染。面完整渲染。面完整渲染。

【技术实现步骤摘要】
网站数据的保存方法及装置


[0001]本专利技术涉及通信技术,尤其涉及一种网站数据的保存方法及装置。

技术介绍

[0002]网站能够为用户提供丰富的网络数据内容,从而为用户的数据访问提供了便利。但是,由于网站必须在联网状态下方可访问,并且,部分网站还会设置访问权限,用户必须通过指定的内网进行访问,一旦脱离内网环境则无法访问。由此可见,如何能够对网站数据进行保存,以使其在断网情况下或缺乏内网权限的情况下灵活访问成为亟待解决的技术难题。
[0003]在相关技术中,通过网页保存方式实现网站数据的保存。例如,浏览器自带的保存网页功能能够将当前网页保存成一个包含HTML(超文本标记语言,HyperText Markup Language)文件和其他资源(图片、样式文件、脚本文件)的文件夹,并将HTML文件中的其他资源路径修改为对应本地文件夹的资源路径,该方法保存的网页在断网条件下或外网环境中打开时,无法获取到需经内网获取的数据,导致页面渲染失败或不完整,而且手动保存所有网页不仅繁琐且访问时页面也无法正常跳转。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种网站数据的保存方法及装置。
[0005]根据本专利技术实施例的一个方面,提供了一种网站数据的保存方法,包括:
[0006]根据目标网站的登录信息,获取与所述目标网站的首页页面相关联的第一页面资源;
[0007]对所述第一页面资源进行处理,根据第一处理结果生成第一页面访问包;
[0008]获取所述目标网站中包含的页面链接,根据所述页面链接获取与所述目标网站的非首页页面相关联的第二页面资源;
[0009]对所述第二页面资源进行处理,根据第二处理结果生成第二页面访问包;
[0010]根据所述第一页面访问包以及所述第二页面访问包,生成用于保存网站数据的网站数据访问包。
[0011]根据本专利技术实施例的又一个方面,提供了一种网站数据的访问方法,包括:通过由上述的方法生成的网站数据访问包,访问网站数据。
[0012]根据本专利技术实施例的又一个方面,提供了一种网站数据的保存装置,包括:
[0013]第一获取模块,适于根据目标网站的登录信息,获取与所述目标网站的首页页面相关联的第一页面资源;
[0014]第一处理模块,适于对所述第一页面资源进行处理,根据第一处理结果生成第一页面访问包;
[0015]第二获取模块,适于获取所述目标网站中包含的页面链接,根据所述页面链接获
取与所述目标网站的非首页页面相关联的第二页面资源;
[0016]第二处理模块,适于对所述第二页面资源进行处理,根据第二处理结果生成第二页面访问包;
[0017]生成模块,适于根据所述第一页面访问包以及所述第二页面访问包,生成用于保存网站数据的网站数据访问包。
[0018]根据本专利技术实施例的又一个方面,提供了一种网站数据的访问装置,包括:
[0019]访问模块,适于通过由上述的方法生成的网站数据访问包,访问网站数据。
[0020]根据本专利技术实施例的又一个方面,提供了一种电子设备,包括:
[0021]一个或多个处理器;
[0022]存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述网站数据的保存方法或访问方法;
[0023]一个或多个I/O接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。
[0024]根据本专利技术实施例的再一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述网站数据的保存方法或访问方法。
[0025]在本专利技术实施例提供的网站数据的保存方法及装置中,能够根据目标网站的登录信息,获取与首页页面相关联的第一页面资源,从而生成第一页面访问包;并根据目标网站中包含的页面链接获取与目标网站的非首页页面相关联的第二页面资源,从而生成第二页面访问包,最终得到用于保存网站数据的网站数据访问包。该方式能够自动获取目标网站的首页以及非首页的各类资源,并保存为可离线访问的访问包。该方式保存的网页在断网条件下或外网环境中打开时,能够通过访问包获取到需经内网获取的数据,从而实现页面完整渲染。该方式无需手动保存所有网页,操作便利,且访问时页面也能够正常跳转。
附图说明
[0026]图1示出了本专利技术实施例一提供的网站数据的保存方法的流程图;
[0027]图2示出了示出了网站访问包的结构示意图;
[0028]图3示出了本专利技术又一实施例提供的网站数据的保存装置的结构图;
[0029]图4为本专利技术又一实施例提供的一种电子设备的结构示意图。
具体实施方式
[0030]为使本领域的技术人员更好地理解本专利技术的技术方案,下面结合附图对本专利技术提供的服务器进行详细描述。
[0031]在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本专利技术透彻和完整,并将使本领域技术人员充分理解本专利技术的范围。
[0032]如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
[0033]本文所使用的术语仅用于描述特定实施例,且不意欲限制本专利技术。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在所述特征、整体、步骤、
操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。
[0034]本文所述实施例可借助本专利技术的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。
[0035]除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本专利技术的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
[0036]图1示出了本专利技术一个实施例提供的网站数据的保存方法的流程图。如图1所示,该方法包括以下步骤:
[0037]步骤S110:根据目标网站的登录信息,获取与目标网站的首页页面相关联的第一页面资源。
[0038]其中,目标网站的登录信息包括:目标网站的网站地址、登录权限信息(如访问账号、密码等)。与目标网站的首页页面相关联的第一页面资源是指:目标网站的首页页面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网站数据的保存方法,其特征在于,包括:根据目标网站的登录信息,获取与所述目标网站的首页页面相关联的第一页面资源;对所述第一页面资源进行处理,根据第一处理结果生成第一页面访问包;获取所述目标网站中包含的页面链接,根据所述页面链接获取与所述目标网站的非首页页面相关联的第二页面资源;对所述第二页面资源进行处理,根据第二处理结果生成第二页面访问包;根据所述第一页面访问包以及所述第二页面访问包,生成用于保存网站数据的网站数据访问包。2.根据权利要求1所述的方法,其特征在于,所述根据目标网站的登录信息,获取与所述目标网站的首页页面相关联的第一页面资源包括:根据目标网站的首页地址信息、账户信息以及内网地址信息,获取目标网站的首页页面加载过程中所需的超文本传输协议HTTP请求信息以及加载完成后的网页渲染信息;根据所述HTTP请求信息以及加载完成后的网页渲染信息,获取与所述目标网站的首页页面相关联的第一页面资源。3.根据权利要求2所述的方法,其特征在于,所述目标网站为内网网站,则所述根据所述HTTP请求信息以及加载完成后的网页渲染信息,获取与所述目标网站的首页页面相关联的第一页面资源包括:根据HTTP请求信息判断对应的页面资源是否属于内网资源;若是,则将该HTTP请求信息对应的页面资源确定为与所述目标网站的首页页面相关联的第一页面资源。4.根据权利要求2所述的方法,其特征在于,所述根据所述HTTP请求信息以及加载完成后的网页渲染信息,获取与所述目标网站的首页页面相关联的第一页面资源包括:根据HTTP请求信息中包含的请求头信息和响应头信息判断与所述HTTP请求信息对应的页面资源的类型;分别获取各种类型的页面资源,得到与所述目标网站的首页页面相关联的第一页面资源;其中,所述页面资源的类型包括:静态文件类型、数据请求类型、以及渲染页面类型。5.根据权利要求4所述的方法,其特征在于,所述对所述第一页面资源进行处理,根据第一处理结果生成第一页面访问包包括:针对所述第一页面访问包中属于静态文件类型的静态文件资源,将所述静态文件资源中的链接地址替换为与所述第一页面访问包相对应的本地存储地址。6.根据权利要求4所述的方法,其特征在于,所述对所述第一页面资源进行处理,根据第一处理结果生...

【专利技术属性】
技术研发人员:郝若晶成晨程新洲吴洋高洁张涛张亚南赫欣夏蕊
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1