WAP页面的结构化显示方法及装置制造方法及图纸

技术编号:9924189 阅读:64 留言:0更新日期:2014-04-16 15:54
本发明专利技术公开一种WAP页面的结构化显示方法及装置,该显示方式包括:接收页面浏览请求,获取该页面浏览请求所请求的原始页面;对该原始页面进行切行,并以行为单位对原始网页进行扫描,获得WAP页面的结构化字段;将所获得的结构化字段进行组合,并对其进行显示。本发明专利技术通过获取页面浏览请求对应的原始页面后,对其进行切行,并获得WAP页面的结构化字段,然后对其进行显示。因此,相对于现有技术的模板抽取技术,本发明专利技术可以适用不同网站的WAP页面显示,而不再需要配置相应的模板,从而降低了人工对模板制作及维护的成本。

【技术实现步骤摘要】
【专利摘要】本专利技术公开一种WAP页面的结构化显示方法及装置,该显示方式包括:接收页面浏览请求,获取该页面浏览请求所请求的原始页面;对该原始页面进行切行,并以行为单位对原始网页进行扫描,获得WAP页面的结构化字段;将所获得的结构化字段进行组合,并对其进行显示。本专利技术通过获取页面浏览请求对应的原始页面后,对其进行切行,并获得WAP页面的结构化字段,然后对其进行显示。因此,相对于现有技术的模板抽取技术,本专利技术可以适用不同网站的WAP页面显示,而不再需要配置相应的模板,从而降低了人工对模板制作及维护的成本。【专利说明】WAP页面的结构化显示方法及装置
本专利技术涉及网页显示领域,尤其涉及一种WAP页面的结构化显示方法及装置。
技术介绍
相对于WWW页面,WAP页面更加简单且适合手机浏览器展现。而且,移动终端的离线阅读应用越来越受到用户的青睐,它给用户提供了收集并统一管理待阅读网页的功能。对于此类阅读应用来说,直接呈现原网页样式及内容会导致用户体验不一、杂乱无章的感觉。因此将网页结构化显示,并提供一致的阅读体验非常重要。现有的网页结构化显示主要利用模板抽取技术。由于同一网站中网页的结构,均由固定的模板所承载,因此在网页内容更新时,承载其的模板不会发生变化。因此,可以对网站配置相应的模板,当显示网页内容时,则从模板中提取需要显示的信息进行结构化后,并对其进行显示。虽然上述模板抽取技术可以实现网页结构化显示,但是其在实际的使用中仍存在以下问题:( I)每个站点都必须配置相应的模板,该模板无法对多个站点实现通用,由此造成的人工制作模板的成本较高;(2)当站点更新后,其配置的模板可能也会失效,因此需要人工及时地维护,由此造成的人工维护的成本较高。
技术实现思路
本专利技术的主要目的是提供一种WAP页面的结构化显示方法,旨在降低了现有技术的WAP页面的显示中,人工对模板制作及维护的成本。本专利技术提供了一种WAP页面的结构化显示方法,包括:接收页面浏览请求,获取该页面浏览请求所请求的原始页面;对该原始页面进行切行,并以行为单位对原始网页进行扫描,获得WAP页面的结构化字段;将所获得的结构化字段进行组合,并对其进行显示。本专利技术还提供了一种WAP页面的结构化显示装置,包括:页面获取模块,用于接收页面浏览请求,获取该页面浏览请求所请求的原始页面;页面结构化模块,用于对该原始页面进行切行,并以行为单位对原始网页进行扫描,获得WAP页面的结构化字段;页面显示模块,用于将所获得的结构化字段进行组合,并对其进行显示。本专利技术通过获取页面浏览请求对应的原始页面后,对其进行切行,并获得WAP页面的结构化字段,然后对其进行显示。因此,相对于现有技术的模板抽取技术,本专利技术可以适用不同网站的WAP页面显示,而不再需要配置相应的模板,从而降低了人工对模板制作及维护的成本。【专利附图】【附图说明】图1是本专利技术WAP页面的结构化显示方法一实施例的流程示意图;图2是本专利技术WAP页面的结构化显示方法中,获取WAP页面的结构化字段的流程示意图;图3是应用现有技术的WAP页面显示方法而显示的WAP页面的示意图;图4是应用本专利技术WAP页面的结构化显示方法而显示的WAP页面的示意图;图5是本专利技术WAP页面的结构化显示装置一实施例的结构示意图;图6是本专利技术WAP页面的结构化显示装置中页面结构化模块的结构示意图;图7是本专利技术WAP页面的结构化显示装置中页面结构化模块的字段抽取单元一实施例的结构示意图;图8是本专利技术WAP页面的结构化显示装置中页面结构化模块的字段抽取单元另一实施例的结构示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。【具体实施方式】以下结合说明书附图及具体实施例进一步说明本专利技术的技术方案。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参照图1,提出了本专利技术WAP页面的结构化显示方法一实施例。该WAP页面的结构化显示方法包括以下步骤:步骤S110、接收页面浏览请求,获取该页面浏览请求所请求的原始页面;本专利技术主要用于移动设备上的WAP页面的显示。该移动设备的后台服务器接收用户端发出的页面浏览请求,并将该页面浏览请求发送至网络服务器,以获得页面浏览请求所请求的原始页面。该原始页面为WAP页面,有用户端需要浏览的信息,也有其他的广告信息、其他网页的链接信息等等。步骤S120、对该原始页面进行切行,并以行为单位对原始网页进行扫描,获得WAP页面的结构化字段;获取到原始页面后,将对其进行切行,即以行为单位对页面进行切分。然后再对其进行逐行扫描,获得WAP页面的结构化字段。该结构化字段可以包括通用的标题、正文等字段。当然也不限定于这些字段。应当理解,在获取到原始页面后,还可以提示用户进行显示模式的选择,该显示模式可以包括普通模式、简洁模式等。如果用户的响应是普通模式,则直接将原始页面进行显示;如果用户的响应是简洁模式,则进行步骤S120、步骤S130。步骤S130、将所获得的结构化字段进行组合,并对其进行显示。获得WAP页面的结构化字段后,将其进行组合,并对其进行显示。本专利技术WAP页面的结构化显示方法通过获取页面浏览请求对应的原始页面后,对其进行切行,并获得WAP页面的结构化字段,然后对其进行显示。因此,相对于现有技术的模板抽取技术,本专利技术可以适用不同网站的WAP页面显示,而不再需要配置相应的模板,从而降低了人工对模板制作及维护的成本。进一步的,参照图2,上述步骤S120包括:步骤S121、对原始页面进行解析,获得解析树;本实施例中,通过DOM方法对原始页面进行解析,获得DOM树,该DOM树中每个节点都是由网页中的所有标记属性构成。步骤S122、查找解析树中的换行标记,并根据换行标记对原始页面以行为单位进行切分;遍历解析树的所有节点,查找获得所有节点的标记属性中表示换行功能的节点信息,并根据该节点信息以行为单位对页面内容进行切分。表示换行功能的标记属性可以包括br、p、div及table等。该对解析树所有节点的遍历可以由根节点向叶节点进行遍历,或者由叶节点向根节点进行遍历。步骤S123、以行为单位对原始页面进行扫描,获得WAP页面的标题字段、正文信息行字段及正文字段。具体地,步骤S123包括:A、查找解析树中是否存在标题属性的节点,是则获取该节点对应的字段作为WAP页面的标题字段;由于页面的标题一般位于页面内容的最前面,所以由解析树的根节点向叶节点进行遍历,直到获得节点的标记属性为标题的节点。例如DOM树节点的class/id属性含有“title”。当然也可以为其他的查找方法,例如页面的标题一般都是单独成行,且不含有其他内容;或者标题是居中设置,可以根据该标题的特性进行标题字段的查找,以获得WAP页面的标题字段。B、以标题字段所在的行为起始行对原始页面进行逐行扫描,判断当前扫描行中是否存在时间字段或来源字段,是则获取当前扫描行的字段作为WAP页面的正文信息行字段;否则继续下一行扫描;WAP页面的正文信息行字段主要是针对WAP资讯,例如资讯的发表时间或者信息来源等等,而且一般在标题行后一段距离。所以,以标题字段所在的行为起始行对原始页面进行逐行扫描,以获取WAP页面的正文信息行字段。C、以正文信息行字段所在本文档来自技高网
...

【技术保护点】
一种WAP页面的结构化显示方法,其特征在于,包括:接收页面浏览请求,获取该页面浏览请求所请求的原始页面;对该原始页面进行切行,并以行为单位对原始网页进行扫描,获得WAP页面的结构化字段;将所获得的结构化字段进行组合,并对其进行显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:蔡兵
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1