当前位置: 首页 > 专利查询>微软公司专利>正文

文档标记方法和系统技术方案

技术编号:2843085 阅读:159 留言:0更新日期:2012-04-11 18:40
描述了模块化内容框架和文档格式方法与系统。所描述的框架和格式定义了一组用于排版、打包、分发和呈现以文档为中心的内容的构件块。这些构件块为文档格式定义了使软件和硬件系统能够可靠且一致地生成、交换和显示文档的平台无关框架。该框架和格式是用灵活且可扩展的方式来设计的。除该通用框架和格式之外,使用该通用框架定义了一种称为影响范围包(reach  package)格式的特定格式。影响范围包格式是一种用于储存分页文档的格式。影响范围包的内容可在各种各样环境中且跨各种各样情形的设备和应用程序之中用完全的保真度来显示或打印。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及内容框架、文档格式以及可以利用这两者的相关方法和系统。
技术介绍
当今,通常有多种不同类型的内容框架来表示内容,且有多种不同类型的文档格式来格式化各种类型的文档。这些框架和格式中的每一种往往需要其自己的相关联软件来构建、产生、处理或消耗相关联的文档。对于在适当的设备上安装了特定的相关联软件的那些人而言,构建、产生、处理或消耗相关联文档并不是很大的问题。对于没有适当的软件的那些人而言,构建、产生、处理或消耗相关联文档通常是不可能的。针对这一事件背景,考虑到文档的产生和消耗,对普遍性有持续的需求。专利技术概述描述了模块化内容框架和文档格式方法与系统。所描述的框架和格式定义了一组用于排版、打包、分发和呈现以文档为中心的内容的构件块。这些构件块定义了使软件和硬件系统能够可靠且一致地生成、交换和显示文档的文档格式的平台无关框架。该框架和格式是以灵活且可扩展方式来设计的。除该通用框架和格式之外,使用该通用框架定义了一种称为影响范围包(reachpackage)格式的特定格式。影响范围包格式是一种用于储存分页文档的格式。影响范围包的内容可在各种各样环境中以及跨各种各样情形的设备和应用程序之中以完全的保真度来显示或打印。附图简述附图说明图1是根据一个实施例的示例性框架和格式的组件的框图。图2是根据一个实施例的容纳包括多个部件的文档的示例性包的框图。图3是示出根据一个实施例的产生包的示例性编写器和读取包的阅读器的框图。图4示出了将三个单独的页面绑定在一起的示例部件。图5是示出根据一个实施例的被安排成产生同时包含报表的英语表示和法语表示两者的财务报表的示例性选择器和序列的图。图6示出了根据一个实施例的共同工作以交流包的编写器和阅读器的某些示例。图7示出了交错文档的多个部件的示例。图8和9示出了将图7所示的文档的多个部件打包的不同示例。图10示出了根据一个实施例的示例性影响范围包以及可构成该包或在该包中找到的每一有效部件类型。图11示出了根据一个实施例的公共语言运行库概念到XML的示例性映射。图12示出了根据一个实施例的竖直和横向字形度量。图13示出了根据一个实施例的一对一群集映射。图14示出了根据一个实施例的多对一群集映射。图15示出了根据一个实施例的一对多群集映射。图16示出了根据一个实施例的多对多群集映射。较佳实施例的详细描述综述本专利技术描述了一种模块化内容框架和文档格式。该框架和格式定义了一组用于排版、打包、分发和呈现以文档为中心的内容的构件块。这些构件块定义了一种使软件和硬件系统能够可靠并一致地生成、交换和显示文档的文档格式的平台无关框架。该框架和格式是以灵活且可扩展的方式来设计的。在各实施例中,对可包括的内容类型、如何呈现内容或构建用于处理内容的客户端的平台没有任何限制。除这一通用框架之外,还使用该通用框架定义了一种特定格式。该格式在本专利技术中被称为影响范围包(reach package)格式,并且是用于储存分页或预分页文档的格式。影响范围包的内容可以在各种各样环境中以及跨各种各样情形的设备和应用程序之中用完全的保真度来显示或打印。下文描述的框架的目标之一是确保独立编写的软件和硬件系统在读取或写入根据下文描述的框架和格式产生的内容时的互操作性。为实现这一互操作性,所描述的格式定义了读取或写入内容的系统必须满足的形式要求。下文的讨论是沿以下线条来组织的,并在两个主要章节中提出-一个名为“框架”,另一个名为“影响范围包格式”。名为“框架”的一节提出了一种说明性的打包模型,并描述了构成框架包的各个部件和关系。讨论了关于使用框架包中的描述性元数据的信息,以及映射到物理容器、扩展框架标记的过程,以及对框架版本化机制的使用。名为“影响范围包格式”的一节研究了被称为影响范围包的一种特定类型的框架构建包的结构。该节也描述了对固定的有效载荷专用的包部件,并定义了一种影响范围包标记模型和绘制模型。本节以示例性影响范围标记元素及其属性(propery)连同所示的样例一起结束。作为以下讨论的高级综述,考虑图1,它概括地在100处示出了本专利技术的框架和格式的各方面。框架的某些示例性组件在102处示出,而影响范围包格式的某些组件在104处示出。框架102包括示例性组件,这些组件包括但不限于,关系组件、可插容器组件、交错/流组件以及版本化/可扩充性组件,其每一个都在下文中更详细地研究。影响范围包格式104包括组件,这些组件包括选择器/定序器组件以及包标记定义组件。在以下讨论中,将周期性地回头参考图1,使得读者可以维持关于所描述的组件在何处适合框架和包格式的观点。框架在以下讨论中,提供了对通用框架的描述。各个初级小标题包括“包模型”、“排版部件选择器和序列”、“描述性元数据”、“物理模型”、“物理映射”、以及“版本化和可扩充性”。每一初级小标题具有一个或多个相关小标题。包模型本节描述了包模型,并包括描述包和部件、驱动程序、关系、包关系和起始部件的小标题。包和部件在所示和描述的模型中,内容被容纳在包内。包(package)是容纳相关部件(part)的集合的逻辑实体。包的目的是将文档的所有片段(或其它类型的内容)收集到程序员和最终用户易于操作的一个对象中。例如,考虑图2,示出了容纳包括若干部件的文档的示例性包200,部件包括表示文档的XML标记部件202、描述文档中使用的字体的字体部件204、描述文档的页面的多个页面部件206、以及表示文档内的图片的图片部件。表示文档的XML标记部件202在它可准许容易的可搜索性和参考,而无需对包的整个内容进行语法分析方面是有利的。这将在下文变得显而易见。贯穿本专利技术,引入并讨论了阅读器(也称为消费器)和编写器(也称为生产器)的概念。本专利技术中使用的术语阅读器指的是读取基于模块化内容格式的文件或包的实体。本专利技术中使用的术语编写器指的是写入基于模块化内容格式的文件或包的实体。作为一个示例,考虑图3,示出了产生包的编写器和读取包的阅读器。通常,编写器和阅读器被具体化为软件。在至少一个实施例中,与创建和格式化包相关联的大多数处理开销和复杂性被施加于编写器上。这进而从阅读器中消除了大多数处理复杂性和开销,如本领域的技术人员所理解的,这是偏离许多现有模型的。这一方面将在下文中变得显而易见。根据至少一个实施例,单个包包含容纳在包内的内容的一个或多个表示。通常,包是单个文件,在本申请中被称为容器。这给予最终用户例如一种以文档的所有组成片段(图像、字体、数据等)来分发其文档的便利方法。尽管包通常直接对应于单个文件,然而不必要总是如此。包是可以用各种方式来物理地表示的逻辑实体(例如,但不限于,以单个文件、松散文件的集合、以数据库、通过网络连接的短暂传输等等)。由此,容器容纳包,但是并非所有的包都储存在容器内。抽象模型独立于任何物理存储机制来描述包。例如,抽象模型并不涉及“文件”、“流”或与包所处的物理领域有关的其它物理术语。如下文所讨论的,抽象模型允许用户为各种物理格式、通信协议等创建驱动程序。用类推的方法,当应用程序希望打印图像时,它使用打印机的抽象(由理解特定种类的打印机的驱动程序呈现)。由此,不要求应用程序知道特定的打印设备或如何与打印设备通信。容器提供了除松散、断开的文件集合之外的许多好处。例如,类似的组件本文档来自技高网...

【技术保护点】
一种系统,包括:一个或多个计算机可读介质;驻留在所述介质上的软件指令,当被执行时,所述软件指令能够用一标记表示来表示文档,所述标记表示包括:将一有序的页面序列逻辑地绑定成单个多页文档的第一元素;以及各自为所述第一元素的子元素且引用所述文档的单个页面的内容源的一个或多个第二元素。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:DF埃默森D奥恩斯坦G谢克特J迪尼埃兹J金S苏布拉马尼亚安OH弗尔W朱MJ希尔伯格DC布朗MV雷诺JD泰纳斯基
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1