支持手机使用自带浏览器展示结构化文档的方法及中间件技术

技术编号:6146485 阅读:259 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种支持手机使用自带浏览器展示结构化文档的中间件,它包括中间件,所述中间件包括获取文档文件的文件流的接收信息模块、将读入的文件流解析成XML格式的第一解析模块、将该XML格式的文件转换成HTML格式文件的第一转换模块、将HTML文件进行DOM结构解析的第二解析模块和将HTML文件转换成XHTML或WML的WAP网页格式的第二转换模块。本发明专利技术还涉及一种支持手机使用自带浏览器展示结构化文档的方法。本发明专利技术的有益效果是:手机可直接打开查看office2000-2007版本中doc,xls,ppt,以及AdobPDF,压缩格式的ZIP,文本TXT等类型文件,无需安装其他文档软件或下载文档。

【技术实现步骤摘要】

本专利技术涉及一种支持手机使用自带浏览器展示结构化文档的方法及中间件
技术介绍
通常手机如果需要对网络系统中Microsoft office类文档,Adobe PDF格式文档, txt文档(文本文档),及Zip压缩格式文件等的查看就必须安装相应的文档编辑软件才可以,而安装软件的形式用户不仅用起来麻烦,而且软件的安装对于手机终端的性能要求也比较高,打开稍大一些的文档就会因耗费资源较多而造成手机死机,用户体验极差。XML (Extensible Markup Language)即可扩展标记语言,它与 HTML—样,都是 SGML (Standard Generalized Markup Language,标准通用标记语言)。HTML (Hyper Text Mark-up Language)即超文本标记语言或超文本链接标示语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。DOM= Document Object Model,文档对象模型,DOM可以以一种独立于平台和语言的方式访问和修改一个文档的内容和结构。换句话说,这是表示和处理一个HTML或XML文档的常用方法。XHTML 可扩展超文本置标语言(extensible HyperText Markup Language),是一种置标语言,表现方式与超文本置标语言(HTML)类似,不过语法上更加严格。WML(无线标记语言,Wireless Markup Language)是一种脚本语言,它比HTML编写的内容要消耗网络浏览器更少的内存和CPU时间,使得WML对广域网和移动设备来说更加友好。WAPCffireless Application Protocol)为无线应用协议,是一项全球性的网络通信协议。Office (全称Microsoft Off ice),是一套由微软公司开发的办公软件,它为 Microsoft Windows 和 Apple Macintosh 操作系统而开发。PDF是Portable Document format(便携文件格式)的缩写,是一种电子文件格式, 与操作系统平台无关,由Adobee公司开发而成。
技术实现思路
为解决上述问题本专利技术提供一种支持手机使用自带浏览器展示结构化文档的方法及中间件。本专利技术解决上述技术问题的技术方案如下一种支持手机使用自带浏览器展示结构化文档的系统,它包括中间件,所述中间件包括获取文档文件的文件流的接收信息模块、 将读入的文件流解析成XML格式的第一解析模块、将该XML格式的文件转换成HTML格式文件的第一转换模块、将HTML文件进行DOM结构解析的第二解析模块和将HTML文件转换成 XHTML或WML的WAP网页格式的第二转换模块。一种支持手机使用自带浏览器展示结构化文档的方法,它包括以下步骤步骤1 移动信息转换中间件(中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源)获取文档文件的文件流; 步骤2 将读入的文件流解析成XML格式; 步骤3 将该XML格式的文件转换成HTML格式文件; 步骤4 将HTML文件进行DOM结构解析; 步骤5 将HTML文件转换成XHTML或WML的WAP网页格式。进一步的,所述步骤1中获取文件流的过程为步骤1.1 接收用户的请求,并获取用户所要打开的文件的参数; 步骤1. 2 判断设定的类型库中的参数是否与步骤1. 1中的参数相对应,如对应则判断文件的类型并保存,如不对应则继续下一步骤;步骤1. 3 判断用户所要打开的文件是否为压缩文件,如果是则取得压缩文件的列表并返回步骤1. 1,如果不是,则继续下一步骤;步骤1. 4 判断文件的类型是否为可以解析的文件类型,如果是则判断其类型并保存, 如果不是则设置为默认的文件类型并保存。进一步的,所述步骤2为通过开源工程POI (Point of Interest,将文件解析成 XML的一个程序库)将读入的文件流解析成XML格式。进一步的,所述步骤3为按照XML格式的文件与HTML格式的文件映射关系将该 XML格式的文件转换成HTML格式文件。进一步的,所述步骤5为按照设定的HTML与XHTML或WML的映射关系,将HTML文件转换成XHTML或WML等WAP网页格式文件。进一步的,所述步骤4为中间件将HTML文件进行DOM结构解析,对文件中不规范的格式进行校正。本专利技术的有益效果是手机可直接打开查看offiCe2000-2007版本中doc,xls (XLS就是Microsoft Excel工作表,是一种非常常用的电子表格格式),ppt (PPT,一种演示文稿图形程序,是Power Point简称),以及Adobe PDF,压缩格式的ZIP,文本TXT等类型文件,无需安装其他文档软件或下载文档。附图说明图1为本专利技术中间件的结构示意图2为本专利技术支持手机使用自带浏览器展示结构化文档的方法的流程图。具体实施例方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。如图1所示,一种支持手机使用自带浏览器展示结构化文档的系统,它包括用于移动信息转换的中间件,所述中间件包括获取文档文件的文件流的接收信息模块、将读入的文件流解析成XML格式的第一解析模块、将该XML格式的文件转换成HTML格式文件的第一转换模块、将HTML文件进行DOM结构解析的第二解析模块和将HTML文件转换成XHTML 或WML的WAP网页格式的第二转换模块。如图2所示,一种支持手机使用自带浏览器展示结构化文档的方法,它包括以下步骤步骤1 中间件(中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源)获取文档文件的文件流;步骤2 通过开源工程POI (Point of Interest,将文件解析成XML的一个程序库),中间件先将读入的文件流解析成XML格式;步骤3 中间件将该XML格式的文件转换成HTML格式文件;步骤4 中间件将HTML文件进行DOM结构解析;步骤5 中间件将HTML文件转换成XHTML或WML的WAP网页格式。所述步骤1中获取文件流的过程为步骤1.1 中间件接收用户的请求并获取用户所要打开的文件的参数; 步骤1. 2 判断中间件的类型库中的参数是否与步骤1. 1中的参数相对应,如对应则判断文件的类型并保存,如不对应则继续下一步骤;步骤1. 3 判断用户所要打开的文件是否为压缩文件,如果是则取得压缩文件的列表并返回步骤1. 1,如果不是,则继续下一步骤;步骤1. 4 判断文件的类型是否为可以解析的文件类型,如果是则判断其类型并保存, 如果不是则设置为默认的文件类型并保存。所述步骤3为中间件通过XML格式的文件与HTML格式的文件映射关系将该XML 格式的文件转换成HTML格式文件。所述步骤5为中间件按照设定的HTML与XHTML或WML的映射关系,将HTML文件转换成XHTML或丽L等WAP网页格式文件。所述步骤4为中间件将HTML文件进行DOM结构解析,对文件中不规范的格式进行校正,即将图片的格式转化为手机可以浏览的大小,将文件的排版改变为手机可以浏览的格式等。如=XHTML规范定义的成对标签〈table〉未本文档来自技高网
...

【技术保护点】
1.一种支持手机使用自带浏览器展示结构化文档的方法,其特征在于,它包括以下步骤:步骤1:获取文档文件的文件流;步骤2:将读入的文件流解析成XML格式;步骤3:将该XML格式的文件转换成HTML格式文件;步骤4:将HTML文件进行DOM结构解析;步骤5:将HTML文件转换成XHTML或WML的WAP网页格式。

【技术特征摘要】

【专利技术属性】
技术研发人员:孟剑
申请(专利权)人:北京神州数码思特奇信息技术股份有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1