一种利用结构化数据实现文档内容自动更新的方法及系统技术方案

技术编号:6994431 阅读:260 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种利用结构化数据实现文档内容自动更新的方法,包括:将数据源中需要更新的内容生成结构化文件;利用文档格式开放的排版软件设计并创建符合应用场景的文档模板;将结构化文件转换为开放文档格式的模板组件;用转换后的组件替换文档模板中的相应组件,并根据该文档模板生成最终的文档。相应地,提供一种实现文档内容自动更新的系统。通过本发明专利技术,在文档模板制作完成之后,不需要人为地进行任何排版操作,就能够利用数据源提供的数据和根据结构化文件而创建的样式表快速而准确地更新文档内容,而且不依靠文档格式所对应应用程序的排版引擎。

【技术实现步骤摘要】

本专利技术涉及计算机排版
,尤其涉及一种利用结构化数据实现文档内容自 动更新的方法及系统。
技术介绍
目前,在印刷排版行业中,出版社经常出版一些版式相同、内容不同的出版物,比 如,相同科目的试卷、政府机关的红头文件以及一些报表等等。出版社绝大多数均采用人工 修改模板的方式来实现文档内容的更新,这种方式费时费力、工作量大、周期长、出错率高, 所花费的成本也高。对于其他企事业单位和大多数个人,对于相同模板的内容更新,往往也 只能依靠人工修改来完成。因此,如何提高出版物和其它文档的排版效率,成为当前计算机 排版技术中的重要问题。在申请号为20061011M98. 6的中国专利申请“一种文字的可变数据排版的方法” 中,提出了 一种能够自动更新文档内容的方法。在该方法中,首先将设计好的文字流模板解 析,从段、行、可变内容项三个层次构建节点数,并将节点数与排版数据进行关联,然后根据 排版内容依次对段、行、可变内容项进行逐级展开,从而实现排版内容的多层次嵌套式的可 变数据排版。但是,这种方法必须依靠文档格式所对应应用程序的排版引擎,在没有应用程 序的排版引擎的情况下无法实现内容更新。
技术实现思路
为了解决现有技术中的以上问题,本专利技术提供一种利用结构化数据实现文档内容 自动更新的方法及系统,以在不依靠文档格式所对应应用程序的排版引擎的情况下实现文 档内容的自动更新。为了实现以上目的,本专利技术提供的利用结构化数据实现文档内容自动更新的方法 包括以下步骤将数据源中需要更新的内容生成结构化文件;利用文档格式开放的排版软 件设计并创建符合应用场景的文档模板;将所生成的结构化文件转换为所述开放文档格式 的模板组件;用转换后的组件替换文档模板中的相应组件,并根据该文档模板生成最终的 文档。相应地,提供一种利用结构化数据实现文档内容自动更新的系统,包括数据输入 单元,输入数据源,并将数据源发送给处理单元;处理单元,对从数据输入单元接收的数据 源进行处理,以生成其中相应内容被该数据源替换的文档,并将替换文档发送给文档输出 单元;文档数据单元,输出从处理单元接收的替换文档。本专利技术将数据源中需要更新的数据生成结构化文件,通过样式表将该结构化文件 转换为符合开放文档格式的模板组件,并用该组件替换该格式文档模板中的相应组件,从 而实现在文档版式、内容样式保留的情况下文档内容的自动更新。在文档模板制作完成之 后,不需要人为地进行任何排版操作,就能够利用数据源提供的数据和根据结构化文件而 创建的样式表快速而准确地更新文档内容。此外,由于本专利技术基于xml进行数据交换,所以可在不依靠文档格式所对应应用程序的排版引擎的情况下实现文档内容的自动更新。 附图说明图1是根据本专利技术的利用结构化数据实现文档内容自动更新的方法的流程图;图2是用于解释图1所示方法的示图;图3是所设计的文档模板效果图;图4是所设计的数据结构的示意图;图5是文档更新效果图;图6是根据本专利技术的利用结构化数据实现文档内容自动更新的系统的框图。 具体实施例方式本专利技术适用于任意文档格式开放的排版软件所输出的文档,目前文档格式开放的 排版软件,比如,微软office 2007 —般采用基于xml组件的格式规范。以下,将结合附图 和实施例对本专利技术进行详细描述。图1是根据本专利技术的利用结构化数据实现文档内容自动更新的方法的流程图,图 2是用于解释图1所示方法的示图。参照图1和图2,该方法包括以下步骤步骤Si、数据结构化步骤在该步骤中,将数据源中需要更新的内容生成结构化文件。具体地,设计文档所需更新内容的数据结构和规范化文件,提取数据源中需要更 新的内容生成结构化文件,并利用所设计的规范化文件对该结构化文件进行规范性验证, 以使该结构化文件符合所设计的结构化规范。这里,结构化文件一般为XML文件,规范化文 件为用于规范XML文件的khema或DTD文件。通常需要根据用户不同的要求制定khema 或DTD文件。这里,数据源可以是一个数据库中的数据,也可以是以其它形式保存的电子数 据。步骤S2、文档模板创建步骤在该步骤中,利用文档格式开放的排版软件设计并创建符合应用场景的文档模 板。这里,所述文档格式开放的排版软件是指该软件所生成的文档结构开放给所有用 户。比如,微软的Office 2007系列软件由于采用基于XML和Zip技术的00XML(0ffice Open XML)文档格式标准(相关内容可参见微软官方网站http//www. microsoft, com/ china/msdn/library/office/office/fford2007XMLFormat. mspx ? mfr = true),所以其文 档模板中的所有ml组件可以开放使用。在实际操作中,比如,对于word 2007,首先打开一 篇空白word文档,然后在该文档中根据需要创建模板,在模板创建完成之后,利用符合Zip 压缩规范的压缩工具对该模板进行解压,从而获得该文档模板中的所有XML组件。获得这 些xml组件之后,便可通过xml文件来更新其中的xml组件,从而更新文档内容。此外,所述符合应用场景的模板是指特定环境下的文档样式,比如,政府机关常采 用的红头文件等。步骤S3、转换步骤在该步骤中,将所生成的结构化文件转换为符合所用开放文档格式的模板组件。在本专利技术中,可利用XSLT转换技术创建一个样式表文件,该样式表文件用于将根 据数据源生成的XML文件转换为一个符合所用开放文档格式的模板组件,即,一个新的XML 文件。XSLT转换技术为XML开发技术人员已知的一种转换技术,因此,省略其描述。当然, 也可使用其它任何XML转换技术来创建样式表文件。步骤S4、文档更新步骤在该步骤中,用转换后的组件替换文档模板中的相应组件,并根据该文档模板生 成最终的文档。比如,对于微软Office 2007,由于其文档为一个zip压缩文件,所以在文档模板 的组件更新之后需要利用符合Zip压缩规范的压缩工具对该模板中的所有文件夹和文件 进行压缩,从而生成最终的文档。从以上描述可看出,本专利技术将数据源中需要更新内容的数据生成xml文件,通过 xslt样式表将该xml文件转换为一个新的符合所利用的开放文档格式的xml文件,并用该 xml文件替换该开放文档格式文档模板中的相应xml文件,从而实现文档模板的更新,进而 更新文档内容。以下,将结合一个具体的示例对本专利技术进行进一步的说明。在该示例中,以word 2007作为本专利技术中所述文档格式开放的排版软件的示例进 行描述。首先,人工利用word 2007创建一个如图3所示的简历模板。在该简历模板中,所 需要更新的内容包括姓名、日期、地址、电话号码、电子邮件地址、网站地址、目标职位和教 育信息,其中,教育信息又包括毕业学校和毕业日期。对于这些需要更新的内容,建立如图 4所示的数据结构。然后,根据图4所示的数据结构将数据源中需要更新的这些内容生成以下xml文件。< ? xml version = “ 1.0〃 encoding = “ UTF-8" ? ><DocRoot><name> 李林 </name><picture>E:\ 我的照片.jpg&本文档来自技高网...

【技术保护点】
1.一种利用结构化数据实现文档内容自动更新的方法,包括以下步骤:(1)将数据源中需要更新的内容生成结构化文件;(2)利用文档格式开放的排版软件设计并创建符合应用场景的文档模板;(3)将所生成的结构化文件转换为符合所述开放文档格式的模板组件;(4)用转换后的组件替换文档模板中的相应组件,并根据该文档模板生成最终的文档。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨勇闫国龙缪萍
申请(专利权)人:北大方正集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1