处理使用标记语言的文档的装置制造方法及图纸

技术编号:2843589 阅读:187 留言:0更新日期:2012-04-11 18:40
用于对以多种标记语言描述的、通过标签集且使用插件来表述的文档进行处理的文档处理装置,例如HTML单元和SVG单元。在待处理的文档以多个标签集来描述的情况下,文档选择能够在元素名和元素的命名空间基础上对文档中所包含的元素进行处理的处理系统。选定的处理系统从所述元素向该元素的子孙元素按顺序地确定元素是否能够处理,处理系统将元素的处理委托给另一处理系统。因此,适当的处理系统被分配给每个元素。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种文档处理技术,尤其涉及处理以标记语言描述的文档的技术。
技术介绍
互联网的出现导致由用户处理和管理的文档的数目近乎指数增长。形成互联网核心的万维网联合会(亦即通常所说的Web)包括由这些文档构成的大规模数据中心库。除了文档,Web还提供用于这些文档的信息检索系统。这些文档通常为标记语言格式,一种简单且常用的标记语言是超文本标记语言(HTML)。这种文档还包括指向可能位于该Web其它部分中的其它文档的链接。可扩展标记语言(XML)是另一种更高级、更常用的标记语言。用于经由Web来访问和查看该文档的简单浏览器用面向对象的编程语言(例如Java)来开发。以标记语言为格式的文档通常在浏览器和其它应用程序中表述为树型数据结构的格式。这种表述与文档的语法分析树相对应。文档对象模型(DOM)是一种众所周知的用于表述和操作文档的基于树的数据结构模型。文档对象模型提供了用于表述文档的标准对象集合,包括HTML和XML文档。DOM包括两个基本组件,即,如何将表述文档中组件的对象进行组合的标准模型,以及用于访问和操作它们的标准接口。应用程序开发者能够支持DOM作为其自身的特定数据结构的接口和应用程序接口(API)。另一方面,创建文档的应用程序开发者可使用标准DOM接口而不是使用其自身API的特定接口。因此,由于这种能够提供标准的能力,DOM能有效地增加各种环境中、尤其是Web上的文档的互操作性。已经定义了DOM的几种变化,由不同的编程环境和应用程序来使用。DOM树是基于相应的DOM的内容对文档的分级表述。DOM树包括“根”以及从根产生的一个或多个“节点”。在某些情况下,根表述整个文档。中间节点可表述元素,诸如表及表中的行和列。DOM树的“叶子”通常表述数据,例如不可进一步分解的文本项目或图像。DOM树中的各个节点可与属性相关联,属性描述了由节点表述的元素的参数,例如字体、大小、颜色、缩进等。虽然HTML是一种创建文档的常用语言,但它是格式和版式语言。HTML不是一种数据描述语言。表述HTML文档的DOM树的节点包括与HTML格式标签相对应的预先定义的元素。由于HTML通常不提供任何数据描述,也不提供任何对数据的标签/标注,因此,常常难以对HTML文档中的数据进行查询。网络设计者的目标是使得Web文档能够被软件应用程序查询或处理。独立显示的分级组织的语言能够通过这种方式查询和处理。诸如XML(可扩展标记语言)的标记语言能够提供这些特征。与HTML相反,众所周知,XML的优点是使得文档设计者能够使用可自由定义的“标签”来对数据元素进行标注。上述数据元素可进行分级组织。另外,XML文档可包含文档类型定义(DTD),它是对文档中所使用的“语法”(标签及其相互关系)的描述。使用CSS(层叠样式表)或XSL(XML样式语言),以定义结构化的XML文档的显示方法。与DOM、HTML、XML、CSS、XSL有关的其它信息以及相关语言特征也可从Web获取,例如,http://www.w3.org/TR/。Xpath提供了用于对XML文档的部分进行寻址的公共的语法和语义。Xpath的功能的一个示例是对与XML文档相对应的DOM树进行遍历。它提供了用于操作与XML文档的各种表述相关联的字符串、数字和布尔字符的基本工具。Xpath对XML文档的摘要、逻辑结构(例如,DOM树)、而不是其表面语法(例如,描述哪根线或哪个字符位于序列中的语法)进行操作。使用Xpath,能够在分级结构中(例如,在XML文档的DOM树中)进行定位。除了用于寻址的用途之外,Xpath还被设计用来测试DOM树中的节点是否与某个模式相匹配。其它涉及Xpath的细节可在http://www.w3.org/TR/中找到。假设XML的有益效果和特征已经公知,需要一种能够对标记语言(例如,XML)构建的文档进行处理的有效的文档处理和管理系统,并提供一种用于创建和修改这些文档的友好的用户界面。可扩展标记语言(XML)特别适合作为用于复合文档(compound document)的格式,或者特别适合用于这种情况的格式,即,某个文档的相关数据与其它文档的数据通过网络等共用的情况。已经开发出许多用于创建、显示和编辑XML文档的应用程序(例如,参见日本已公开的专利申请No.2001-290804)。可随意地定义词汇。因此理论上,可能存在无限多个词汇。然而,不可能单独提供这些词汇专用的显示/编辑环境。在相关技术中,如果以不具有专用编辑环境的词汇来描述文档,那么由文本数据构成的文档的源代码(source)可直接使用文本编辑器等进行编辑。能够处理XML文档的现有的应用程序在市场上能够获得,但是它们具有显著的局限性,并且遇到了妨碍其被广泛接受的障碍。本文描述的方法和装置解决了迄今为止还未被上述现有产品及其所代表的现有技术所解决的问题。例如,在现有的XML文档处理装置的实现中,作为一种内容表达的XML文档与其显示方法无关的这一特征可能在表面上被视为一种优势。然而,上述特征实际上是不利的,这是因为用户不能直接对其进行编辑。为了解决这一问题,现有的XML文档处理产品特别设计了用于XML输入的屏幕。但是,由于现有XML产品必须预先进行硬编码(hard code),因此限制了屏幕设计的灵活性。由于这一局限性,XSLT在之前作为样式表语言的标准之一被开发。这是一种能够将用户从硬编码工作中释放出来的技术,并且与显示XML文档的可应用方法相兼容。然而,XSLT不能够仅通过显示XML文档实现对该XML文档的编辑。此外,现有XML产品主要依赖于“架构(schema)”的设置。因此,只要确定了架构,便具有这样的局限性,即,仅能处理与来自顶层的架构结构相对应的XML文档。换言之,该系统是一种硬性(rigid)系统。
技术实现思路
整个XML文档的结构不需要硬性确定。通过将具有各种结构的复合XML文档分为多个部分,并将该文档分配到优选地用插件表示的编辑模块,能够安全处理该复合XML文档,从而能够获得灵活的系统。此外,不受硬编码限制,用户能够实现灵活的屏幕设计,并利用WYSIWYG(所见即所得)对所实现的屏幕进行编辑。本专利技术针对上述情况而提出,并相应提供能够有效地对以一种或多种例如XML类型语言的标记语言来描述的文档进行处理的方法和装置。本专利技术的一些示例性实施方案涉及文档处理装置,例如这样的文档处理装置,其包括多个处理单元,多个处理单元的每一个处理以特定标签集描述的共用文档,并适于通过与各个标签集相对应的处理单元在共用显示媒介(例如共用显示屏幕)上对以多种类型的标签集描述的文档进行显示,以接受用户对文档的编辑。本专利技术还涉及一种文档处理方法,尤其是这样一种文档处理方法,其通过与各标签集相对应的处理单元在共用显示媒介(例如共用显示屏幕)上对采用多种类型的标签集描述的文档进行显示,以接受用户对文档的编辑。这里应该注意,在方法、装置、系统等之间改变的上述结构组件和表达式的任意组合对于本专利技术的实施方案都是有效的。根据本专利技术,能够提供用于有效地处理以一种或多种标记语言描述的文档的技术,以用于实现生成、编辑、显示和/或存储操作中的至少一种或多种。附图说明图1以方框图的方式示出了根据本专利技术的一个示例性而非限制性实施方案本文档来自技高网
...

【技术保护点】
一种文档处理装置,其可操作以处理具有一个或多个词汇的复合文档,用于显示给用户以进行编辑,从而有利于对所述复合文档进行编辑,所述文档处理装置包括:多个处理单元,所述多个处理单元中的每一个可操作以在预定标签集的基础上对文档或文档的一部分 进行处理;以及显示处理装置,其响应于所述多个处理单元,用于为在单一显示媒介上向所述用户显示所述复合文档做准备。

【技术特征摘要】
【国外来华专利技术】JP 2004-4-8 114529/2004;US 2004-8-2 60/592,369;JP 1.一种文档处理装置,其可操作以处理具有一个或多个词汇的复合文档,用于显示给用户以进行编辑,从而有利于对所述复合文档进行编辑,所述文档处理装置包括多个处理单元,所述多个处理单元中的每一个可操作以在预定标签集的基础上对文档或文档的一部分进行处理;以及显示处理装置,其响应于所述多个处理单元,用于为在单一显示媒介上向所述用户显示所述复合文档做准备。2.如权利要求1所述的文档处理装置,还包括词汇转换器,当所述复合文档包括了所述多个处理单元中的至少一个单元不能处理的标签集所定义的部分时,所述词汇转换器可操作以将用于该部分的标签集映射为能够由所述多个处理单元中的至少一个来处理的标签集。3.如权利要求1所述的文档处理装置,其中,当所述复合文档包括了所述多个处理单元中的至少一个单元不能处理的标签集所定义的部分时,所述文档处理装置将该部分呈现为源显示或者树显示。4.如权利要求1到3中任一项所述的文档处理装置,其中,所述显示处理装置可操作以呈现与所述复合文档待编辑的部分相对应的编辑菜单。5.如权利要求1到4中任一项所述的文档处理装置,其中,对于包括多种标签集的复合文档,能够对用于第一种标签集的数据进行处理的处理单元可操作以访问所述复合文档的、由不同于所述第一标签集的第二标签集构成的部分的数据。6.如权利要求1到4中任一项所述的文档处理装置,其中,所述复合文档由多个元素表述,所述多个元素中的每一个包含选择信息;根据从一元素中获取的选择信息,将所述多个处理单元中能够处理所述文档中的该元素的一个处理单元选为选定的处理单元。7.如权利要求6所述的文档处理装置,其中,从所述元素中获取的所述选择信息包括元素名和元素命名空间的至少其中之一。8.如权利要求6或7所述的文档处理装置,其中,从所述元素中获取的所述选择信息包括所述元素中所包含的属性的属性名和属性值的至少其中之一。9.如权利要求6到8中任一项所述的文档处理装置,其中,被选择来处理元素的处理单元从所述元素向其子元素按顺序地确定元素是否能够处理,当存在不能处理的元素时,所述处理单元可操作以至少委托另一个处理单元作为选定的处理单元处理所述元素,或者制止所述元素的处理。10.如权利要求9所述的文档处理装置,其中,当所述处理单元能够处理元素,且另一个处理单元也能够处理所述元素时,所述处理单元能够选择是由所述处理单元还是由所述另一个处理单元作为选定的处理单元来处理所述元素。11.如权利要求1到4中任一项所述的文档处理装置,还包括管理单元,所述管理单元用于生成和管理具有与文档对象模型相符的格式的数据,所述文档对象模型被定义成提供一种访问方法,用来以处理数据方式处理所述文档,其中,所述管理单元生成对应于所述文档的文档对象模型数据;以及根据从表述所述文档对象模型数据的DOM树的子树的顶节点中获得的信息,将一处理单元选为选定的处理单元。12.如权利要求11所述的文档处理装置,其中,所述选定的处理单元从所述顶节点向所述顶节点的子节点增加对象,所述增加的对象包括专用于所述节点的s,并且所述选定的处理单元委托另一个处理单元对不能增加所述对象的节点进行处理。13.如权利要求6到12中任一项所述的文档处理装置,其中,所述处理单元中的至少一个可操作以处理多个标签集。14.一种文档处理方法,用于对具有一个或多个词汇的复合文档进行处理以有利于对所述复合文档进行编辑,所述方法包括提供多个处理,所述多个处理中的每一个在用于显示的预定标签集的基础上对文档或文档的一部分进行处理;处理所述文档的所述多个标签集以在共用的显示媒介上进行显示;以及对用户输入进行响应以编辑所述文档。15.一种计算机程序产品,其可操作以控制计算机执行用于处理具有一个或多个词汇的复合文档的方法,以有利于对所述复合文档进行编辑,包括提供多个处理,所述多个处理中的每一个在用于显示的预定标签集的基础上对文档或文档的一部分进行处理;处理所述文档的所述多个标签集以在共用的显示媒介上进行显示;以及对用户输入进行响应以编辑所述文档。16.一种用于...

【专利技术属性】
技术研发人员:和家伸明大岛教雄藤卷祐介桧山正幸
申请(专利权)人:佳思腾软件公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1