一种图片作为翻页链接的识别方法及装置制造方法及图纸

技术编号:9667952 阅读:170 留言:0更新日期:2014-02-14 06:25
本发明专利技术公开了一种图片作为翻页链接的识别方法及装置,涉及通信技术领域,解决了现有技术中仅能识别出文字类作为翻页标识的技术问题。其中,该方法主要包括:根据翻页图片识别规则筛选出网页中符合条件的图片;解析所述图片中的文字以及收集用户对所述图片的操作行为数据;根据所述解析出的文字和/或针对所述图片的操作行为数据确定所述图片为翻页标识。本发明专利技术主要用于网页浏览。

【技术实现步骤摘要】
一种图片作为翻页链接的识别方法及装置
本专利技术涉及通信
,特别涉及一种图片作为翻页链接的识别方法及装置。
技术介绍
移动设备上的网页浏览器是用户方便快捷的浏览网页重要工具,使用分页的方法显示内容也广泛地用于新闻,图书,论坛等网站,在具有分页内容的网页中,现代的网页浏览器通常采用手势或者快捷按键的方式切换页数,并且支持对下一页网页内容的预读取功倉泛。欲实现上述的预读取功能,网页浏览器必须对网页中的翻页链接(即翻页标识)进行搜索和识别,从而获得目标页的超级链接。目前,一种解决方案是通过搜索网页中是否存在内容为连续整数的文字,且每个整数包含一个超级链接,以此为依据判断为翻页的标识。但是现有技术的上述解决方案至少存在以下问题:该方案只能识别文字类的分页标识,而对于用图片作为翻页标识的情况,则无法匹配成功,进而找不到翻页链接,导致无法实现预读取功能。
技术实现思路
为了解决现有技术中以图片作为翻页标识的情况下,如何查找到翻页链接,进而实现预读取功能问题,本专利技术的提出一种图片作为翻页链接的识别方法及装置。一种图片作为翻页链接的识别方法,包括:根据翻页图片识别规则筛选出网页中符合条件的图片;解析所述图片中的文字以及收集用户对所述图片的操作行为数据;根据所述解析出的文字和/或针对所述图片的操作行为数据确定所述图片为翻页标识。一种图片作为翻页链接的识别装置,包括:筛选单元,用于根据翻页图片识别规则筛选出网页中符合条件的图片;解析单元,用于解析所述图片中的文字;收集单元,用于收集用户对所述图片的操作行为数据;确定单元,用于根据所述解析单元所解析出的文字和/或根据所述收集单元收集的针对所述图片的操作行为数据确定所述图片为翻页标识。本实施例提供的方案解决了现有技术中只能识别文字类的翻页标识的技术问题,使之对于在网页中以图片作为翻页标识的情况下,仍旧可以识别出图片的翻页标识,从而满足了对这类网页的快捷翻页和预读功能的实现的技术效果。【附图说明】附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例1中的一种图片作为翻页链接的识别方法的流程示意图;图2为本专利技术实施例2中的一种图片作为翻页链接的识别方法的流程示意图;图3为本专利技术实施例3中的一种图片作为翻页链接的识别装置的结构示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。并且,以下各实施例均为本专利技术的可选方案,实施例的排列顺序及实施例的编号与其优选执行的顺序无关。实施例1本实施例提供一种图片作为翻页链接的识别方法,如图1所示,该方法包括:步骤101,根据翻页图片识别规则筛选出网页中符合条件的图片。上述翻页图片识别规则包括但不限于下面的规则:图片的宽度和高度处于10-200像素区间;图片包含超级链接;图片所包含的超级链接地址与网页的网址的起始部分相同。其中,起始部分是指统一资源定位器(URL, Uniform Resource Locator)的Host主机地址部分。通过步骤101可以过滤掉明显不可能是作为翻页标识的图片,因为在实际应用中,同一个网站网页上的翻页标识图片都是同一张图片,即HTML内容中的〈imgsrc=”……”/>的src都是同一路径,并且通常图片形状的不会太大,而且若作为翻页图片使用的话,该图片便可能包含超级链接,所以根据这些特点,可以对翻页图片进行初步的筛选,符合上述的三个筛选条件的图片,可以初步判断为翻页标识。步骤102,解析图片中的文字以及收集用户对图片的操作行为数据。这里的图片的操作行为数据主要指用户对该图片的点击次数。在步骤102中解析图片文字的过程与收集用户操作行为数据的过程在执行顺序上不分先后,也可以同时执行。因为在本实施例以及下述实施例中,对网页中各图片的操作行为数据的收集过程是可以实时进行的。步骤103,根据解析出的文字和/或根据针对图片的操作行为数据确定图片为翻页标识。上述步骤103是用于对于在步骤101中筛选出的图片进行进一步的筛选的过程,该进一步的筛选过程包括根据解析出的文字进行确定和/或根据针对步骤101中的筛选出的图片所收集的操作行为数据进行确定。这两个确定过程可以选择只执行其一,例如仅执行根据解析出的文字确定该图片是否为翻页标识,或者仅执行收集的操作行为数据确定图片是否为翻页标识。但是,为了更加准确的确定图片是否为翻页标识,更优选的方案是将两个确定过程均执行。即可以先根据解析出的文字确定图片是否为翻页标识,并在确定为不是翻页标识时,再根据针对该图片收集的操作行为数据确定是否为翻页标识;或者先根据针对该图片收集的操作行为数据确定是否为翻页标识,并在确定为不是翻页标识时,再根据解析出的文字确定图片是否为翻页标识。有关该更优选的方案的具体执行过程请参照下述实施例2。在确定该图片为翻页标识后,便可以读取该图片所包含的超级链接地址,查找到下一页将要显示的内容,进而实现预读取功能。由于本专利技术在识别出图片标识后实现预读取的功能的过程可按照现有技术进行,因此在本实施例以及下述实施例中均不在多做说明。上述方法主要用于与浏览器一起配合使用,实现预读取功能,因此该方法应该部署与浏览器部署在同一设备上。该设备可以是终端,也可以是服务器等。本实施例提供的方法中,解决了现有技术中只能识别文字类的翻页标识的技术问题,使之对于在网页中以图片作为翻页标识的情况下,仍旧可以识别出图片的翻页标识,从而满足了对这类网页的快捷翻页和预读功能的实现的技术效果。实施例2本实施例提供一种图片作为翻页链接的识别方法,如图2所示,该方法包括:步骤201,根据翻页图片识别规则判断网页中符合条件的图片,若判定翻页图片识别规则中的三个条件均符合,则执行步骤202 ;否则,当有任意条件不符合时执行步骤207 ;翻页图片识别规则包括:图片的宽度和高度处于10-200像素区间;图片包含超级链接;图片所包含的超级链接地址与网页的网址URL的Host主机地址相同;步骤202,根据符合条件的图片所包含的超级链接地址与网页的网址的相识度对符合条件的图片进行优先级排序。按照优先级进行排序可帮助尽快判断出该图片是否为翻页标识。当然完全相似的图片其优先级别最高,因为最有可能是翻页标识。步骤203,按照优先级别的顺序解析每张图片中的文字字符;若解析出的文字字符所代表的意义与翻页意义匹配,如解析出的意义为“下一页”或者“下页”等文字,则执行步骤204 ;否则执行步骤205 ;步骤204,确定图片为翻页标识。步骤205,收集用户对图片的操作行为数据。具体而言,步骤205是将筛选出的图片的源地址和网页的源地址本文档来自技高网...

【技术保护点】
一种图片作为翻页链接的识别方法,其特征在于,包括:根据翻页图片识别规则筛选出网页中符合条件的图片;解析所述图片中的文字以及收集用户对所述图片的操作行为数据;根据所述解析出的文字和/或针对所述图片的操作行为数据确定所述图片为翻页标识。

【技术特征摘要】
1.一种图片作为翻页链接的识别方法,其特征在于,包括: 根据翻页图片识别规则筛选出网页中符合条件的图片; 解析所述图片中的文字以及收集用户对所述图片的操作行为数据; 根据所述解析出的文字和/或针对所述图片的操作行为数据确定所述图片为翻页标识。2.根据权利要求1所述的方法,其特征在于,所述根据所述解析出的文字确定所述图片为翻页标识具体包括: 解析所述图片中的文字字符; 若解析出的文字字符所代表的意义与翻页意义匹配,则确定所述图片为翻页标识。3.根据权利要求1或2所述的方法,其特征在于,所述收集用户对所述图片的操作行为数据具体包括: 将筛选出的图片的源地址和网页的源地址相同的图片归纳为一条记录,并统计每条记录中用户对图片的点击次数。4.根据权利要求3所述的方法,其特征在于,所述根据针对所述图片的操作行为数据确定所述图片为翻页标识具体包括: 若针对所述图片统计的点击次数超出预设的点击阈值,则确定所述图片为翻页标识。5.根据权利要求1或2所述的方法,其特征在于,在所述根据翻页图片识别规则筛选出网页中符合条件的图片之后,该方法还包括: 根据符合条件的图片所包含的超级链接地址与所述网页的网址的相识度对所述符合条件的图片进行优先级排序。6.根据权利要求1或2所述的方法,其特征在于,所述翻页图片识别规则包括: 图片的宽度和高度处于10-200像素区间; 图片包含超级链接; 图片所包含的超级链接地址与所述网页的网址的起始部分相同。7.一种图片作为翻页链接的识别装置,其特征在于,包括: 筛选单元,用于根据翻页图片识别规则筛选出...

【专利技术属性】
技术研发人员:涂远林
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1