网址图标的获取方法和获取装置制造方法及图纸

技术编号:10049840 阅读:148 留言:0更新日期:2014-05-15 20:13
本发明专利技术公开了一种网址图标的自动获取方法和自动获取装置。所述方法包括:获取待匹配图标的网址;根据所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的网址图标进行提取操作。本发明专利技术实现了基于图标网页内容自动提取网址图标的方案,解决了通过手工的方式来维护网址与对应的网址图标带来的手工维护成本大,效率低,对新建的网址与对应图标之间的映射关系更新不及时,系统实时性差的技术问题。

【技术实现步骤摘要】

本专利技术实施例涉及通信技术和数据处理领域,尤其涉及一种网址图标的获取方法和获取装置
技术介绍
随着互联网上网页站点的不断增加,越来越多的人们将获取网页站点的方式从传统的通过搜索获取转向通过导航网站的导航网页获取。所谓导航网站,就是一个集合较多网址,并按照一定条件进行分类的一种网站。导航网站方便用户快速找到自己需要的网站,而不用去记住各类网站的网址,就可以直接进到所需的网页站点。在图1中示出了一个现有技术中常用导航网站的示意图。如图1所示,导航网站中包括了系统推荐的和/或用户自定义添加的多个网站的网站名称,当用户需要访问一个网站时,只需在导航网站中点击对应的网站名称,即可快速打开对应的网址。另外,为了增加网站的辨识度,便于用户阅读和查找,导航网站中的网址还会同时以图标的形式表示出来,这些图标上显示了对应网站的标识或者LOGO(徽标)图片等,方便用户一目了然的找到自己想要访问的网站。为了实现网址名称与网址图标的一并显示,需要预先存储并实时维护网址与网址图标的对应关系。现有技术中,导航网站在出现网址图标变化,或用户添加新的网址时,均需要进行图标的更新维护。例如,当用户向导航网站输入待添加网址后,系统根据网址在预存的网址图标映射表中进行正则匹配或字符串匹配的方法进行查询,找到系统中网址对应的图标,从而添加到导航网站的网页中进行显示。但是,在现有技术中,是通过手工的方式来维护网址图标映射表的,其主要缺陷是:手工维护成本大,效率低;对新建的网址与对应图标之间的映射关系更新不及时,系统实时性差。
技术实现思路
有鉴于此,本专利技术实施例提供一种网址图标的获取方法和获取装置,解决了网址与对应的网址图标的维护成本大,效率低,更新不及时的问题。在第一方面,本专利技术实施例提供了一种网址图标的获取方法,包括:获取待匹配图标的网址;根据所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的网址图标进行提取操作。在第二方面,本专利技术实施例提供了一种网址图标的获取装置,包括:网址获取单元,用于获取待匹配图标的网址;网址图标提取单元,用于根据所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的网址图标进行提取操作。本专利技术实施例通过获取待匹配图标的网址,根据所述网址获取对应的图标网页内容,从所述图标网页内容中提取与所述网址对应的网址图标的技术手段,该技术方案能够从网页内容中自动提取网址图标,在大大减少了在维护网址图标映射表过程中人工参与的同时,实现了网址与对应的网址图标的匹配过程,解决了通过手工的方式来维护网址与对应的网址图标带来的手工维护成本大,效率低,对新建的网址与对应图标之间的映射关系更新不及时,系统实时性差的技术问题,降低了手工维护带来的成本,提高了网址与对应网址图标的匹配效率。附图说明图1是现有技术中的一个常用导航网站的示意图;图2是本专利技术第一实施例的一种网址图标获取方法的流程图;图3是本专利技术第二实施例的一种网址图标获取方法的流程图;图4是本专利技术第三实施例的一种网址图标获取方法的流程图;图5是本专利技术第四实施例的一种网址图标获取方法的流程图;图6是本专利技术第五实施例的一种网址图标获取方法的流程图;图7是本专利技术第六实施例的一种网址图标获取装置的结构图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。第一实施例图2是本专利技术第一实施例的一种网址图标获取方法的流程图,本实施例的方法可以由网址图标获取装置来执行,该装置可通过硬件和/或软件的方式实现,一般可集成于导航网站的服务器内。本实施例的方法具体包括如下操作:210、获取待匹配图标的网址。在本实施例中,服务器获取待匹配图标的网址,典型的,上述服务器可以为导航网站的服务器。其中,服务器获取的待匹配图标的网址的来源可以为:使用导航网站的一般用户在添加一个自己需要的常用网址时,向该服务器发送的;或者,网络爬虫在网络中抓取到网页后,提取网页的URL(Uniform Resource Locator,统一资源定位符)后,向该服务器发送的;或者,网站的建立者在网站建立之后,将新建网站的网址主动向该服务器上报的。当然,本领域技术人员可以理解,服务器还可以采用其他的方式获取待匹配图标的网址,对此并不限定。在本实施例中,所述待匹配图标的网址是指需要获取对应图标的网址。其中,与一个网址对应的图标可以为与该网址对应网站的网站LOGO、或者与网站功能对应的标识图片等,对此并不限定。220、根据所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的网址图标进行提取操作。在一个例子中,一个采用标准化方式建立的网站,网址图标会存储在一个预定的目录下,举例而言,网址为http://www.baidu.com的网站,网址图标存储于http://www.baidu.com/favicon.ico目录下;更一般的,不管采用何种方式建立的网站,只要该网站中包括有网址图标,该网站网址图标的存储路径就会写入该网站的对应的网页内容的脚本文件中。相应的,在本实施例中,根据所述网址来获取对应的图标网页内容可以包括:根据所述网址中的特征信息,构造图标默认存储地址,根据该图标默认存储地址,获取网址图标;或者根据与所述网址对应的网页内容查找与所述网址对应的网址图标的存储路径,根据所述存储路径,获取与所述网址对应的网址图标。其中,一个网址的特征信息中包括:协议信息、域名信息和目录信息。举例而言,对于一个网址http://www.baidu.com/about.htm:协议信息为:http,代表该网址在URL中使用的协议;域名信息为:www.baidu.com,代表该网址对应的服务器名称;目录信息为:/about.htm,代表该网址在上述服务器中所在的目录名称。本专利技术实施例通过获取待匹配图标的网址,根据所述网址获取对应的图标网页内容,从所述图标网页内容中提取与所述网址对应的网址图标的技术手段,在大大减少了在维护网址图标映射表过程中人工参与的同时,实现了网址与对应的网址图标的匹配过程,解决了通过手工本文档来自技高网
...
网址图标的获取方法和获取装置

【技术保护点】
一种网址图标的获取方法,其特征在于,包括:获取待匹配图标的网址;根据所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的网址图标进行提取操作。

【技术特征摘要】
1.一种网址图标的获取方法,其特征在于,包括:
获取待匹配图标的网址;
根据所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网
址对应的网址图标进行提取操作。
2.根据权利要求1所述的网址图标的获取方法,其特征在于,所述根据
所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的
网址图标进行提取操作具体包括:
获取所述网址中的协议信息和域名信息;
根据所述协议信息、所述域名信息与图标默认存储名称,构造图标默认存
储地址;
根据所述图标默认存储地址,获取与所述网址对应的网址图标。
3.根据权利要求2所述的网址图标的获取方法,其特征在于,所述图标
默认存储名称具体包括:favicon.ico。
4.根据权利要求1所述的网址图标的获取方法,其特征在于,所述根据
所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的
网址图标进行提取操作具体包括:
获取与所述网址对应的网页内容;
根据所述网页内容,查找与所述网址对应的网址图标的存储路径;
根据所述存储路径,获取与所述网址对应的网址图标。
5.根据权利要求1所述的网址图标的获取方法,其特征在于,
所述获取待匹配图标的网址具体包括:将查询网址添加到图标获取任务队
列中;从所述图标获取任务队列中获取待匹配图标的网址;
相应地,根据所述网址获取对应的图标网页内容,从所述图标网页内容中

\t对所述网址对应的网址图标进行提取操作之后,还包括:
如果能从所述图标网页内容中提取与所述网址对应的网址图标,则将所述
网址从所述图标获取任务队列删除;
如果未能从所述图标网页内容中提取与所述网址对应的网址图标,将所述
网址移动至无图标网址列表,为所述网址启动定时器,在所述定时器到时截止
后,将所述网址移动至图标获取任务队列,以重新进行对应网址图标的自动获
取。
6.根据权利要求5所述的网址图标的获取方法,其特征在于,将所述网
址移动至无图标网址列表之后,还包括:
记录所述网址移动至所述无图标网址列表的移动次数;
如果所述移动次数超过移动阈值,丢弃所述网址。
7.根据权利要求1所述的网址图标的获取方法,其特征在于,所述根据
所述网址获取对应的图标网页内容,从所述图标网页内容中对所述网址对应的
网址图标进行提取操作之后,所述方法还包括:
将所述网址中的协议信息和域名信息作为联合主键,与提取到的所述网址
图标的属性信息对应存储于网址图标映射表中;
其中,所述网...

【专利技术属性】
技术研发人员:陈浩然魏明伟杨小珊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1