【技术实现步骤摘要】
本专利技术涉及通信领域,特别涉及一种用于文档构建的数据加工方法和装置。
技术介绍
随着互联网的快速发展,各种媒体传播方式层出不穷,数字资源传播越发的快速和普及,从而带来了阅读方式的改变。大量的读者从传统的纸质阅读转变为利用计算机等电子设备进行电子阅读。在文档数字化的过程中,为了实现文档的数字化显示,需要对文档进行数据加工, 并对其中的数据格式进行定义。但是,目前主要基于以下两种格式来显示数据加工后的文档第一种格式采用图片的形式,将文档生成图片,供用户在线阅读;第二种格式采用HF文件的形式,将文档生成PDF文件,供用户下载或在线阅读。但是,这两种方式都存在一定的缺陷采用图片形式时,即使对传输图片进行压缩,压缩比也比较低,不能从根本上节省带宽和传输时间,而且还会损失图片的清晰度。采用PDF文件形式时,若对其在线阅读可能还需要用户端安装相应的插件,不够便捷。由此可见,现有技术普遍存在如下缺陷在对文档进行数据加工时,没有专门定义能够在网络中传输以及在用户端展示的数据格式;且用户端很难从图片中解析出构成文档的各种元素,如文本、图片等,自然也无法控制这些元素的展示样式和风格 ...
【技术保护点】
一种用于文档构建的数据加工方法,其特征在于,包括:根据文档类型将所述文档分成至少一个信息层次,定义每个信息层次对应的语法规则;根据所述语法规则,生成文档中每个信息层次所对应的目标文件。
【技术特征摘要】
1.一种用于文档构建的数据加工方法,其特征在于,包括 根据文档类型将所述文档分成至少一个信息层次,定义每个信息层次对应的语法规则; 根据所述语法规则,生成文档中每个信息层次所对应的目标文件。2.如权利要求I所述的方法,其特征在于,所述目标文件类型为XML文件。3.如权利要求2所述的方法,其特征在于,所述语法规则通过XML文件的DTD进行定义,所述DTD中包含生成该信息层次所对应的XML文件时所需的元素和属性。4.如权利要求I所述的方法,其特征在于,当所述文档类型对应为报纸时,将报纸分成第一信息层次和第二信息层次。5.如权利要求4所述的方法,其特征在于,所述第一信息层次包括版面名称和版面路径信息,所述第二信息层次包括版面上的文章及图片信息。6.如权利要求4所述的方法,其特征在于,当所述语法规则通过XML文件的DTD进行定义时,所述第一信息层次对应的XML文件的DTD中的元素包括报纸类型、版面列表和版面概要;其中,...
【专利技术属性】
技术研发人员:文秀,
申请(专利权)人:汉王科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。