当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于版面格式模板的排版方法及装置制造方法及图纸

技术编号:3846176 阅读:321 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于版面格式模板的排版方法及装置,用以解决现有技术中排版过程效率低的问题。该方法通过在解析公文样式模板文件,获取公文样式模板文件中对应的每个描述信息解析待排版的文档获取元数据信息,在匹配成功时,根据公文样式模板文件中的公文元素式样子文件中的每个描述信息中引用的公文样式模板文件中式样子文件中预先设置的式样将对应的元数据灌入,生成排版后的文档,在本发明专利技术实施例中,由于预先设置了多个模板,保证了每个模板设置的统一性,并且模板中每个描述信息引用预先设定的样式,从而可以有效的提高排版的效率,同时在进行排版时,数据与样式分别进行处理避免了相互之间的影响和制约,提高了排版的准确性。

【技术实现步骤摘要】

本专利技术涉及数字处理
,尤其涉及一种基于版面格式模板的排版方法及装置
技术介绍
版面格式是指一类文体其版面所具有的固定格式,对于不同种类的文体其具有不 同的版面格式,例如对于公文类文体其上行文是一种版面格式,对于保险公司的保单类文 体其是另一种版面格式。目前,基于不同的版面格式会采用不同的模板,例如对于公文类的文体会采用一 种上行文模板,对于保险公司的保单会采用一种保单模板,即都是基于不同的版面格式生 成不同的模板,基本上没有对各个版面格式中的基本要素进行抽取,也没有根据抽取的基 本要素建立对应的模型。并且,在现有技术中,当需要针对一种版面格式进行排版时,只能根据该版面格式 进行具体的设置生成对应的模板后再进行排版,当针对另一版面格式进行排版时,需要再 针对该版面格式设置对应的模板再进行排版,因此在模板创建上需要浪费很大的精力,并 且创建的模板没有统一性。并且在同一版面格式中可能有多个不同部分的内容有相同的格 式要求,当在具体进行模板的设置时,需要针对该多个不同的部分分别设置对应的格式,需 要付出很多重复性的劳动,从而影响了排版的效率。
技术实现思路
有鉴于此,本专利技术实施例提供一种基于版面格式模板的排版方法及装置,用以解 决现有技术中排版过程效率低的问题。本专利技术实施例提供的一种基于版面格式模板的排版方法,包括获取待排版的文档,解析所述文档中的每个元数据信息,并根据选择的公文样式 模板文件,解析所述公文样式模板文件,获取所述公文样式模板文件对应的每个描述信息, 其中所述公文样式模板文件包括式样子文件以及公文元素式样子文件;将所述每个元数据信息与所述公文元素式样子文件中的每个描述信息进行匹 配;当匹配不成功时,提示用户选择的模板错误;否则,根据所述每个描述信息中引用的所述式样子文件中预先设置的式样将所述 元数据信息灌入,生成排版后的文档。本专利技术实施例提供的一种基于版面格式模板的排版装置,包括获取解析模块,用于获取待排版的文档,解析所述文档中的每个元数据信息,并根 据选择的公文样式模板文件,解析所述公文样式模板文件,获取所述公文样式模板文件对 应的每个描述信息,其中所述公文样式模板文件包括式样子文件以及公文元素式样子文 件;匹配模块,用于将所述每个元数据信息与所述公文元素式样子文件中的每个描述 信息进行匹配;排版提示模块,用于在确定匹配不成功时,提示用户选择的模板错误,在确定匹配 成功时,根据所述每个描述信息中引用的所述式样子文件中预先设置的式样将所述元数据 信息灌入,生成排版后的文档。本专利技术实施例提供了 一种基于版面格式模板的排版方法及装置,该方法通过在解 析公文样式模板文件,获取公文样式模板文件中对应的每个描述信息解析待排版的文档获 取元数据信息,在匹配成功时,根据公文样式模板文件中的公文元素式样子文件中的每个 描述信息中引用的公文样式模板文件中式样子文件中预先设置的式样将对应的元数据灌 入,生成排版后的文档,在本专利技术实施例中,由于预先设置了多个模板,保证了每个模板设 置的统一性,并且模板中每个描述信息引用预先设定的样式,从而可以有效的提高排版的 效率,同时在进行排版时,数据与样式分别进行处理避免了相互之间的影响和制约,提高了 排版的准确性。附图说明 图1为本专利技术实施例提供的排版系统的结构示意图;图2为本专利技术实施例提供的根据该图1提供的排版系统结构图进行的具体排版操 作;图3为本专利技术实施例提供的页面式样示意图;图4为本专利技术实施例提供的字体声明示意图;图5为本专利技术实施例提供的句式样示意图;图6为本专利技术实施例提供的段落式样描述示意图;图7为本专利技术实施例提供的文字表式样示意图;图8为本专利技术实施例提供的单元格式样示意图;图9为本专利技术实施例提供的图像对象式样示意图;图10为本专利技术实施例提供的图形对象式样示意图;图11为本专利技术实施例提供的图形对象中自然段描述信息示意图;图12为本专利技术实施例提供的公文元素式样描述信息示意图;图13为本专利技术实施例提供的公文元素式样中页面描述信息示意图;图14为本专利技术实施例提供的公文元素式样中页描述信息示意图;图15为本专利技术实施例提供的页描述信息中眉首的描述信息示意图;图16为本专利技术实施例提供的对文档进行排版的过程;图17为本专利技术实施例提供的公文元素式样中文档的眉首、主体和版记中的每项 描述信息的示意图;图18为本专利技术实施例提供的基于版面格式模板的排版装置结构示意图。 具体实施例方式本专利技术实施例为了有效地提高排版的效率,提供了一种基于版面格式模板的排版 方法,该方法包括获取待排版的文档数据,解析所述文档数据中的每个元数据信息,并解析选择的公文样式模板文件,获取所述公文样式模板文件对应的每个描述信息,其中所述公文样式模板文件包括式样子文件以及公文元素式样子文件;将所述每个元数据信息与 所述公文元素式样子文件中对应的每个描述信息进行匹配;当匹配不成功时,提示用户选 择的模板错误;否则,根据所述每个描述信息中引用的所述式样子文件中预先设置的式样 将对应的所述元数据信息灌入,生成排版后的文档。在本专利技术实施例中,由于预先设置了多 个模板,保证了每个模板设置的统一性,并且模板中每个样式信息引用预先设定的样式,从 而可以有效的提高排版的效率,同时在进行排版时,数据与样式分别进行处理避免了相互 之间的影响和制约,提高了排版的准确性。下面结合说明书附图,对本专利技术实施例进行详细描述。图1为本专利技术实施例提供的排版系统的结构示意图,其中,排版引擎可以实现对 文档的排版,样式模块管理单元用于根据各种样式格式定义,及保存的各种样式设计工具 生成各种样式模板文件。在该样式模板文件中包括式样集子文件以及公文元素式样子文 件等,生成的样式模板文件可以是可扩展标记语言(Extensible Markup Language,XML)格 式的文件。数据模板管理单元用于根据公文元数据定义,及保存的数据设计工具解析待排 版的数据文件生成数据模板文件,该生成的数据模板文件可以是XML格式的文件。规则模 板管理单元用于根据公文规则定义生成规则模板文件,该生成的规则模板文件可以是XML 格式的文件。在本专利技术实施例中样式模板、数据模板和规则模板分别进行管理,从而相互之间 相对独立,而生成的排版后的文件,可以看作是三类模板的有机结合,即对三类模板的分别 编辑和重用的结果。图2为根据该图1提供的排版系统结构图进行的具体排版操作,该排版的过程具 体包括S201 样式模板管理单元中读取用户选择的公文样式模板文件,该公文样式模板 文件为XML格式的文件,解析该公文样式模板文件提取该公文样式模板文件中的每个描述 信息,生成样式树,其中该样式树以XML格式显现,并将该XML格式的样式树发送到排版装 置例如排版引擎。即该公文样式模板文件与该样式树相对应,该样式树中包括式样集子树、公文元 素式样子树等。并且,在本专利技术实施例中样式树中还可以包括排版规则子树。S202:数据模板管理单元读取用户输入的数据文件,解析该数据文件获取数据文 件中的每个元数据信息,生成元数据树,其中该元数据树以XML格式显现,并将该XML格式 的元数据树发送到排版引擎。S203:排版引擎根据接收的元数据树和样式树,进行相应信息的匹配。S204:当匹配成功时,排版引擎根本文档来自技高网...

【技术保护点】
一种基于版面格式模板的排版方法,其特征在于,包括:获取待排版的文档,解析所述文档中的每个元数据信息,并解析选择的公文样式模板文件,获取所述公文样式模板文件对应的每个描述信息,其中所述公文样式模板文件包括:式样子文件以及公文元素式样子文件;将所述每个元数据信息与所述公文元素式样子文件中对应的每个描述信息进行匹配;当匹配不成功时,提示用户选择的模板错误;否则,根据所述每个描述信息中引用的所述式样子文件中预先设置的式样,将对应的所述元数据信息灌入,生成排版后的文档。

【技术特征摘要】

【专利技术属性】
技术研发人员:谢云开王学武吴於茜肖建国
申请(专利权)人:北京大学北大方正集团有限公司北京方正电子政务信息科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1