一种网页标记语言格式转换方法及系统技术方案

技术编号:6144705 阅读:342 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种网页标记语言格式转换方法及系统,方法包括定义原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则;根据原页面类型和目标页面类型提取对应规则模板直接对原页面标签和属性进行映射处理,生成需要转换的目标页面。因此在进行诸如将HTML格式页面向手持终端使用的WML或XML格式转换时不用改变原手持终端的系统,只是将原有系统HTML页面自动转换为手机终端能够通用支持的XHTML、WML或自定义XML等WAP格式页面进行展现的方式,实现系统移动化快速实施。本发明专利技术还提供了一种网页标记语言格式转换系统。

【技术实现步骤摘要】

本专利技术涉及文本转换的方法及系统,尤其是一种网页标记语言格式转换的方法及系统。
技术介绍
随着移动互联网的发展,企事业单位为充分利用移动互联网资源,以及手持终端实时办公的便捷性,都迫切的需要将现有IT系统,快速移植到手持终端使用。而采用传统的WAP开发方式实现系统移动化,需要重新设计系统流程逻辑,以及对原有系统进行改造并进行相关接口的开发,这些都会造成项目实施工作量大,成本高,风险大等问题,而采用定制终端方式进行开发,除工作量大,成本高等问题外,又存在着对于终端性能要求较高, 不同终端操作平台互不兼容,对不可开放平台(如黑莓)无法开发等问题。因此,在不改变原有系统,只是将原有系统HTML页面自动转换为手机终端能够通用支持的XHTML、WML或自定义XML等WAP格式页面进行展现的方式,实现系统移动化快速实施是必要的。
技术实现思路
本专利技术所要解决的技术问题是提供一种网页标记语言格式转换的方法及系统,解决上述传统开发中的问题。本专利技术解决上述技术问题的技术方案如下一种网页标记语言格式转换方法,包括步骤A 定义原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则;步骤B 根据原页面类型和目标页面类型提取对应规则模板直接对原页面标签和属性进行映射处理,生成需要转换的目标页面。本专利技术的有益效果是实现IT系统的移动化,解决了传统IT系统移动化开发方式中工作量大,成本高,风险高,终端平台限制等问题,可便捷的用于系统移动化的快速实施器。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,所述原页面类型为HTML格式,目标页面类型为WML或XML格式。进一步,步骤A包括定义HTML页面格式标记语言标签和属性到WML或XML页面格式标记预言标签和属性的映射规则模板文档;所述步骤B包括将HTML格式网页经过自定义格式的模板文档,根据模板定义规则对页面中数据进行过滤和页面重排,然后自动进行页面校正,之后根据XHTML-MP标签规范, 对页面进行标签解析,对不支持的标签进行过滤,对支持标签根据标签属性规则生成页面 DOM树,最后根据定义好的映射规则,将原标签映射生成对应的WML或XML目标格式的标签。进一步,所述步骤B中根据模板定义规则对页面中数据进行过滤和页面重排,然后自动进行页面校正包括对标签未闭合的自动添加闭合标签,书写错误的标签进行校正或删除。 本专利技术还提供了一种网页标记语言格式转换系统,包括手持终端、应用服务器以及分别连接所述手持终端和所述应用服务器的中间件;所述中间件存储有原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则模板文档,所述中间件根据手持终端提交的请求提取应用服务器的原页面并根据规则模板转换成手持终端可识别的目标页面格式后将目标页面返回所述手持终端。 进一步,所述中间件包括用于进行传输协议的解析,对请求报文头,请求数据格式进行编辑处理以及对请求终端的型号、操作系统参数识别的请求处理器、用于将请求处理器处理后的请求发送给实际要访问的应用服务器,并接收应用服务器提供的响应原页面数据的内容获取器以及用于根据存储的原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则模板文档将内容获取器得到的应用服务器响应原页面数据转化为目标页面并返回所述手持终端的响应处理器。附图说明图1为本专利技术一种网页标记语言格式转换系统示意图; 图2为本专利技术一种实施例a标签的转换流程图3为本专利技术另一种实施例对页面中R)rm标签的处理流程图; 图4为本专利技术另一种实施例对Image的处理流程图。具体实施例方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。本专利技术提供了一种网页标记语言格式转换方法,包括预先定义原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则;根据原页面类型和目标页面类型提取对应规则模板直接对原页面标签和属性进行映射处理,生成需要转换的目标页面。作为一种实施例,将原HTML转换为WML或XML的具体转换方法为预先定义HTML 标签到WML或XML格式标记语言标签和属性之间的映射规则,在接收到原HTML页面后根据原页面类型和目标页面类型提取对应规则模板直接对原页面标签和属性进行映射处理,对于HTML到XHTML的转换,程序先将HTML页面根据标签及属性的包含关系解析成DOM树结构,将书写错误或缺失的标签进行补填、过滤或校正,再根据XHTML-MP规范将DOM树结构中XHTML不支持的标签及属性过滤掉,形成新的XHTML能够支持的DOM树结构,最后再将该 DOM树重新解析拼装成页面。经转换处理后数据格式为手机自带WAP浏览器或第三方XML 解析器可以解析的标记语言。图1为本专利技术一种网页标记语言格式转换系统的示意图,如图所示,包括手持终端、应用服务器以及分别连接所述手持终端和所述应用服务器的中间件;所述中间件存储有原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则模板文档,所述中间件根据手持终端提交的请求提取应用服务器的原页面并根据规则模板转换成手持终端可识别的目标页面格式后将目标页面返回所述手持终端。其中,中间件包括请求处理器,内容获取器和响应处理器三个部分。请求处理器主要进行传输协议的解析,对请求报文头,请求数据格式等的编辑处理以及对请求终端的型号、操作系统等参数的识别;内容获取器主要是作为代理将请求处理器处理后的请求发送给实际要访问的应用服务器,并拿到应用服务器给出的响应数据,此处要确保中间件能够访问到应用服务器中间件才能获取到响应数据,从而进行下面的格式转换等操作;响应处理器由模板过滤器,网页矫正器,文本转换器,图片转换器等不同功能的小插件组成,实现将内容获取器得到的HTML格式的页面进行数据过滤、页面排版,页面的自动纠正校错,文本网页及office文档到XHTML-MP、WML或自定义WML格式的转换,图片的缩放,常用格式间(jpg、 png、bmp、gif等)的相互转换等操作,最后响应处理器将转换处理后得到的新格式页面响应给终端浏览器进行显示。中间件先将获取的HTML格式网页经过自定义格式的模板文档,根据模板定义规则对页面中数据进行过滤和页面重排,然后自动进行页面校正,如标签未闭合的自动添加闭合标签,书写错误的标签进行校正或删除等,之后根据XHTML-MP标签规范,对页面进行标签解析,对不支持的标签进行过滤,对支持标签根据标签属性规则生成页面DOM树,最后根据中间件中定义好的映射规则,将原标签映射生成新格式的标签,如HTML中的a标签对应生成WML中的anchor标签,最后由终端WAP浏览器进行转换后页面解析展现。图2为a 标签的转换流程图;图3为对页面中R)rm标签的处理流程图;图4为对Image的处理流程。以上所述仅为本专利技术的较佳实施例,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。权利要求1.一种网页标记语言格式转换方法,包括步骤A 定义原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映本文档来自技高网...

【技术保护点】
1.一种网页标记语言格式转换方法,包括步骤A:定义原页面格式标记语言标签和属性到需要转换成的目标页面格式标记语言标签和属性之间的映射规则;步骤B:根据原页面类型和目标页面类型提取对应规则模板直接对原页面标签和属性进行映射处理,生成需要转换的目标页面。

【技术特征摘要】

【专利技术属性】
技术研发人员:孟剑
申请(专利权)人:北京神州数码思特奇信息技术股份有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1