一种网页数据获取方法及装置制造方法及图纸

技术编号:9520748 阅读:93 留言:0更新日期:2014-01-01 18:01
本发明专利技术公开了一种网页数据获取方法及装置,其中,该方法包括:获取浏览器当前激活页面的资源数据和各个资源数据对应的路径数据;解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录;将所述各个资源数据与各个所述文件夹目录进行匹配,并将所述各个资源数据存储至与之匹配的文件夹目录下;将存储所述资源数据的文件夹目录及其包括的资源数据进行压缩打包,以生成对应的压缩文件包,并将生成的压缩文件包发送给预定服务器。采用本发明专利技术,研发人员可通过读取该压缩文件包直接复现浏览器的当前激活页面,提高工作效率。

【技术实现步骤摘要】
一种网页数据获取方法及装置
本专利技术涉及到网络通信
,特别涉及到一种网页数据获取方法及装置。
技术介绍
随着智能电视的快速发展,DTV(DigitalTelevision,数字电视)和OTT(OTT是“OverTheTop”的缩写,是指通过互联网向用户提供各种应用服务)网络业务应用快速的发展,智能电视的业务系统引入的业务应用越来越多,而这些业务应用都需要通过智能电视的浏览器来实现,即需要嵌入式浏览器支持的功能需求越来越复杂,例如,HTML5音视频播放、3D页面显示、Widget应用、多窗口展示、网络离线存储等新业务应用的迅速推广需求。在诸多新的功能需求和复杂的应用面前,业务开发人员在编码的过程中出现问题的可能性在逐渐的增加,一旦编码出现问题,则浏览器在运行过程中就会出现显示异常、功能异常等,甚至出现难以定位的问题和不可预料的异常问题,进而导致用户无法正常使用智能电视。当浏览器的这类异常问题出现时,就需要浏览器开发人员及时定位和解决出现的异常问题,因而,获取出现问题的页面和恢复页面流程调用的关系对解决出现的异常问题起着至关重要的作用。现有技术中,当智能电视上的浏览器页面展示或功能出现异常时,由开发人员指导现场工作人员进行组网,与同一个网段内的电脑进行连接,然后再通过抓包软件(如wireshark软件,网络封包分析软件)进行抓取网络包后保存,将保存后的网络包发送给浏览器的开发人员;浏览器开发人员对接收到的网络包进行分析,如:提取各种各样的页面数据,并且重新提取页面调用关系和修改各种页面数据(例如图片、css文件、js文件,在抓包软件抓取这些页面数据时是将页面的每一资源数据当作独立的个体来抓取的,因此并不会保存各个资源数据之间的关联关系,在开发人员进行异常分析之前,需要手工重建它们之间的关联关系),才能进行问题的复现,从而找到解决问题的方法;这样的一个过程非常复杂并且耗时,往往定位一个问题需要很长的时间,极大的降低了解决问题的速度。
技术实现思路
本专利技术的主要目的为提供一种网页数据获取方法及装置,获取浏览器当前激活页面的资源数据和各个资源数据对应的路径信息,并将该资源数据存储至与之匹配的文件夹目录下,将存储该资源数据的文件夹目录及其包括的资源数据进行压缩打包,以生成对应的压缩文件包。研发人员可从该预定服务器中读取该压缩文件包直接复现出现异常的浏览器的当前激活页面,而不需人工对出现异常的当前激活页面进行复现(包括重建各资源数据之间的关联关系),提高效率。本专利技术提供一种网页数据获取方法,该方法包括以下步骤:获取浏览器当前激活页面的资源数据和各个资源数据对应的路径数据;解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录;将所述各个资源数据与各个所述文件夹目录进行匹配,并将所述各个资源数据存储至与之匹配的文件夹目录下;将存储所述资源数据的文件夹目录及其包括的资源数据进行压缩打包,以生成对应的压缩文件包,并将生成的压缩文件包发送给预定服务器。优选地,所述解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录;将所述各个资源数据与各个所述文件夹目录进行匹配,并将所述各个资源数据存储至与之匹配的文件夹目录下的步骤具体为:解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录及该文件夹目录下文件的文件名;将所述各个资源数据的名称与各个所述文件夹目录下文件的文件名进行匹配,若有所述文件夹目录下文件的文件名与所述资源数据的名称匹配,则将所述资源数据存储至与所述资源数据的名称匹配的文件夹目录下。优选地,所述获取浏览器当前激活页面的资源数据和各个资源数据对应的路径数据的步骤还包括:获取浏览器当前激活页面的父页面的资源数据和各个资源数据对应的路径数据。优选地,所述解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录及该文件夹目录下文件的文件名的步骤之后,该方法还包括:判断所述路径数据对应的文件夹目录是否存在,若所述路径数据对应的文件夹目录不存在,则重新创建所述路径数据对应的文件夹目录。优选地,所述资源数据包括网络数据、图片文件、css文件及/或js文件。本专利技术还提供一种网页数据获取装置,该装置包括:第一获取模块,与所述第一获取模块连接的解析模块,与所述解析模块连接的匹配存储模块,与所述匹配存储模块连接的生成模块,与所述生成模块连接的发送模块,其中:该第一获取模块,用于获取浏览器当前激活页面的资源数据和各个资源数据对应的路径数据;该解析模块,用于解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录;该匹配存储模块,用于将所述各个资源数据与各个所述文件夹目录进行匹配,并将所述各个资源数据存储至与之匹配的文件夹目录下;该生成模块,用于将存储所述资源数据的文件夹目录及其包括的资源数据进行压缩打包,以生成对应的压缩文件包;该发送模块,用于将所述生成的压缩文件包发送给预定服务器。优选地,所述解析模块还用于解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录及该文件夹目录下文件的文件名;所述匹配存储模块还用于将所述各个资源数据的名称与各个所述文件夹目录下文件的文件名进行匹配,若有所述文件夹目录下文件的文件名与所述资源数据的名称匹配,则将所述资源数据存储至与所述资源数据的名称匹配的文件夹目录下。优选地,所述第一获取模块用于获取浏览器当前激活页面的父页面的资源数据和各个资源数据对应的路径数据。优选地,该装置还包括与所述解析模块连接的判断模块,与所述判断模块和匹配存储模块分别连接的重建模块,其中:该判断模块,用于判断所述路径数据对应的文件夹目录是否存在;该重建模块,用于在所述判断模块的判断结果为所述路径数据对应的文件夹目录不存在时,重新创建所述路径数据对应的文件夹目录。优选地,所述资源数据包括网络数据、图片文件、css文件及/或js文件。采用本专利技术,通过获取浏览器当前激活页面的资源数据和各个资源数据对应的路径信息,并将该资源数据存储至与之匹配的文件夹目录下,将各资源数据按照实际调用关系进行存储,并将存储所述资源数据的文件夹目录及其包括的资源数据进行压缩打包,以生成对应的压缩文件包,并将生成的压缩文件包发送给预定服务器。该生成的压缩文件包不仅包括了资源数据,还相应的包括了各资源数据的实际调用关系。研发人员可从该预定服务器中读取该压缩文件包直接复现浏览器的当前激活页面,提高工作效率。附图说明图1为本专利技术的网页数据获取方法的第一实施例流程示意图;图2为本专利技术的网页数据获取装置的第一实施例结构框图;图3为本专利技术的网页数据获取装置的第二实施例结构框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参照图1,图1为本专利技术的网页数据获取方法的第一实施例流程示意图,该方法包括:S10、获取该浏览器当前激活页面的资源数据和各个资源数据对应的路径数据。当智能电视上的浏览器出现异常时(如显示异常和视频播放异常等)或用户想对浏览器数据进行分析时,由工作人员通过网络登录智能电视后台系统,在系统内首先查找该浏览器进程的进程ID号,如输入linux命令:ps|grep–r“browser”,可以得到浏览器的进程号ID,本文档来自技高网
...
一种网页数据获取方法及装置

【技术保护点】
一种网页数据获取方法,其特征在于,该方法包括以下步骤:获取浏览器当前激活页面的资源数据和各个资源数据对应的路径数据;解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录;将所述各个资源数据与各个所述文件夹目录进行匹配,并将所述各个资源数据存储至与之匹配的文件夹目录下;将存储所述资源数据的文件夹目录及其包括的资源数据进行压缩打包,以生成对应的压缩文件包,并将生成的压缩文件包发送给预定服务器。

【技术特征摘要】
1.一种网页数据获取方法,其特征在于,该方法包括以下步骤:获取浏览器当前激活页面的资源数据和各个资源数据对应的路径数据;解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录;将所述各个资源数据与各个所述文件夹目录进行匹配,并将所述各个资源数据存储至与之匹配的文件夹目录下;将存储所述资源数据的文件夹目录及其包括的资源数据进行压缩打包,以生成对应的压缩文件包,并将生成的压缩文件包发送给预定服务器。2.根据权利要求1所述的方法,其特征在于,所述解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录;将所述各个资源数据与各个所述文件夹目录进行匹配,并将所述各个资源数据存储至与之匹配的文件夹目录下的步骤具体为:解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录及该文件夹目录下文件的文件名;将所述各个资源数据的名称与各个所述文件夹目录下文件的文件名进行匹配,若有所述文件夹目录下文件的文件名与所述资源数据的名称匹配,则将所述资源数据存储至与所述资源数据的名称匹配的文件夹目录下。3.根据权利要求1或2所述的方法,其特征在于,所述获取浏览器当前激活页面的资源数据和各个资源数据对应的路径数据的步骤还包括:获取浏览器当前激活页面的父页面的资源数据和各个资源数据对应的路径数据。4.根据权利要求2所述的方法,其特征在于,所述解析各个所述路径数据,以得到各个所述路径数据对应的文件夹目录及该文件夹目录下文件的文件名的步骤之后,该方法还包括:判断所述路径数据对应的文件夹目录是否存在,若所述路径数据对应的文件夹目录不存在,则重新创建所述路径数据对应的文件夹目录。5.根据权利要求1所述的方法,其特征在于,所述资源数据包括网络数据、图片文件、css文件及/或js文件。6.一种网页数据获取装置,其特征在于,...

【专利技术属性】
技术研发人员:赵剑萍
申请(专利权)人:深圳TCL新技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1