网页的访问方法及装置制造方法及图纸

技术编号:12876230 阅读:59 留言:0更新日期:2016-02-17 12:30
本发明专利技术提供一种网页的访问方法及装置。本发明专利技术实施例通过确定网页的访问受到限制,进而获取代理服务器的信息,使得能够利用所述代理服务器的信息,访问所述网页,由于能够自动获取代理服务器的信息,因此,使得无需用户手动搜索发布代理服务器的网站,操作简单,并且成功率高,从而提高了网页访问的效率和可靠性。

【技术实现步骤摘要】
【专利说明】
本专利技术涉及互联网技术,尤其涉及一种网页的访问方法及装置。【
技术介绍
】随着互联网行业的发展,网页内容所提供的信息日渐丰富,网页上所展示的数据内容也随之越来越丰富。在访问网页的过程中,由于一些网页所属的网站为访问受限网站,例如,外国网站或学校网站等,使得这些网页无法正常访问。在这种情况之下,用户需要利用相关的关键词例如,代理服务器发布网站等,进行搜索操作,以获得发布代理服务器的网站入口。用户访问所获得的发布代理服务器的网站,利用其所发布的代理服务器,分别进行访问代理设置,以使得能够利用可用的代理服务器,访问这些网页。这样,会导致操作复杂,操作时间长,并且成功率不高,从而降低了网页访问的效率和可靠性。【
技术实现思路
】本专利技术的多个方面提供一种网页的访问方法及装置,用以提高网页访问的效率和可靠性。本专利技术的一方面,提供一种网页的访问方法,包括:确定网页的访问受到限制;获取代理服务器的信息;利用所述代理服务器的信息,访问所述网页。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述确定网页的访问受到限制,包括:获取所述网页的访问请求;根据所述网页的访问请求,确定所述网页无法访问;根据访问受限列表,确定所述网页所属网站为访问受限网站;确定所述网页的访问受到限制。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取代理服务器的信息,包括:根据所述网页的网页标识,获取所述代理服务器的信息。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取代理服务器的信息之前,还包括:利用网络爬虫,获取代理服务器集合,所述代理服务器集合中包括可用的至少一个代理服务器中每个代理服务器的信息,以供根据所述代理服务器集合,获取所述代理服务器的信息。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用网络爬虫,获取代理服务器集合之后,还包括:对所述至少一个代理服务器进行质量验证;对没有通过质量验证的代理服务器的信息,进行过滤处理。本专利技术的另一方面,提供一种网页的访问装置,包括:访问单元,用于确定网页的访问受到限制;获取单元,用于获取代理服务器的信息;所述访问单元,还用于利用所述代理服务器的信息,访问所述网页。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述访问单元,还用于获取所述网页的访问请求;根据所述网页的访问请求,确定所述网页无法访问;根据访问受限列表,确定所述网页所属网站为访问受限网站;以及确定所述网页的访问受到限制。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取单元,具体用于 根据所述网页的网页标识,获取所述代理服务器的信息。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括采集单元,用于利用网络爬虫,获取代理服务器集合,所述代理服务器集合中包括可用的至少一个代理服务器中每个代理服务器的信息,以供根据所述代理服务器集合,获取所述代理服务器的信息。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述采集单元,还用于对所述至少一个代理服务器进行质量验证;以及对没有通过质量验证的代理服务器的信息,进行过滤处理。由上述技术方案可知,本专利技术实施例通过确定网页的访问受到限制,进而获取代理服务器的信息,使得能够利用所述代理服务器的信息,访问所述网页,由于能够自动获取代理服务器的信息,因此,使得无需用户手动搜索发布代理服务器的网站,操作简单,并且成功率高,从而提高了网页访问的效率和可靠性。另外,采用本专利技术所提供的技术方案,通过对所获取的代理服务器集合中所包括的可用的至少一个代理服务器中每个代理服务器进行质量验证,进而对没有通过质量验证的代理服务器的信息,进行过滤处理,能够有效保证所获取的代理服务器的质量。另外,采用本专利技术所提供的技术方案,无需用户手动搜索发布代理服务器的网站,对用户完全透明,能够有效提高用户的访问体验。【【附图说明】】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的网页的访问方法的流程示意图;图2为本专利技术另一实施例提供的网页的访问装置的结构示意图;图3为本专利技术另一实施例提供的网页的访问装置的结构示意图。【【具体实施方式】】为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本专利技术保护的范围。可以理解的是,本专利技术所涉及的网页,也可以称为网页或Web网页,可以是基于超文本标记语言(HyperText Markup Language,HTML)编写的网页(Web Page),即 HTML 网页,或者还可以是基于HTML和Java语言编写的网页,S卩Java服务器网页(Java Server Page,JSP),或者还可以为其他语言编写的网页,本实施例对此不进行特别限定。Web网页可以包括由一个或者多个网页标签例如,超文本标记语言(HyperText Markup Language,HTML)标签、JSP标签等,定义的一个显示区块,称为网页元素,例如,文字、图片、超链接、按钮、输入框、下拉框等。需要说明的是,本专利技术实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、个人电脑(Personal Computer, PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。图1为本专利技术一实施例提供的网页的访问方法的流程示意图,如图1所示。101、确定网页的访问受到限制。102、获取代理服务器的信息。103、利用所述代理服务器的信息,访问所述网页。需要说明的是,101?103的执行主体可以为位于本地终端的应用,或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧的服务器中的搜索引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定,本实施例对此不进行特别限定。可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),例如,浏览器应用、手机百度应用等,或者还可以是终端上的浏览器的一个网页当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种网页的访问方法,其特征在于,包括:确定网页的访问受到限制;获取代理服务器的信息;利用所述代理服务器的信息,访问所述网页。

【技术特征摘要】

【专利技术属性】
技术研发人员:庞凯
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1