模板文档自动生成方法技术

技术编号:13050355 阅读:64 留言:0更新日期:2016-03-23 15:56
本发明专利技术公开了一种模板文档自动生成方法,包括根据模板文档生成DOM格式目录树,并产生与之相匹配的决策树;调整优化决策树,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率;通过决策树遍历效率及模板文档生成效率筛选出最优与之DOM数据路相匹配的决策树模型;按照筛选出的决策树模型,生成已经进行替换和属性变更的文档。本发明专利技术提供的这种模板文档自动生成方法,由于采用了与DOM格式目录树相匹配的决策树,并通过对决策树的筛选最终生成最优的决策树模型,并依据该决策树模型生成模板文档,因此本发明专利技术能够不受目录树的深度或层次的影响,能够高效、快速的生成模板文档。

【技术实现步骤摘要】

本专利技术属于智能信息管理及应用
,具体涉及。
技术介绍
随着信息技术的高速发展,信息技术渗入至各行各业,为每个行业带来了翻天覆地的变化,不仅优化了工作流程,而且很大程度上提高了工作效率。作为模板性文档特别多的科研院所、设计单位,为了提高工作效率、降低文档差错率,每个单位迫切需要一个解决此类模板性文档自动生成文件的工具,并全面提升工作效率及质量,其模板文档快速生成文件需要高效的快速生成方法。基于D0M目录树自定义标签遍历方法是模板文档生成文件的一种可行方法(找到相应的自定义标签进行数据信息替换),其基本步骤主要是:首先根据文档材料动态生成相关的D0M目录树格式;其次在D0M目录树的基础上进行自定义标签遍历,基于D0M目录树模型模板文档生成具有简单有效且计算结果准确等特点,但其随着D0M目录树的深度或层次的增加,其遍历量按指数级增加,影响模板文档生成效率,从而很大程度上制约了该方法在模版文档自动生成方面的深入应用。
技术实现思路
本专利技术的目的在于提供一种高效、快速的。本专利技术提供的这种,其特征在于包括如下步骤: S1根据模板文档生成D0M格式目录树,并产生与之相匹配的决策树; S2对步骤S1产生的决策树进行多叉和多级调整优化,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率; S3通过决策树遍历效率及模板文档生成效率筛选出最优与之D0M数据路相匹配的决策树模型; S4按照S3中筛选出的决策树模型,生成已经进行替换和属性变更的文档。所述的步骤S1中的产生相匹配的决策树,为在遍历D0M格式目录树的同时,按同样的树形结构生成决策树,决策树的节点来自D0M目录树,决策树的节点通过标识进行标注,标识决策树节点有无子节点,节点下有无模板标签及标签类型,且当D0M目录树上节点下无模板标签,则决策树删除此节点,直到D0M目录树遍历完成,从而生成完整的决策树。所述的遍历优化决策树,为采用深度优先算法进行遍历。所述的筛选出最优的决策树模型,为依据遍历时间最小原则筛选出决策树模型。本专利技术提供的这种,由于采用了与D0M格式目录树相匹配的决策树,并通过对决策树的筛选最终生成最优的决策树模型,并依据该决策树模型生成模板文档,因此本专利技术能够不受目录树的深度或层次的影响,能够高效、快速的生成模板文档。【附图说明】图1为DOM格式目录树的结构示意图。图2为D0M格式目录树的树形图。图3为D0M相匹配的决策树的结构示意图。图4为D0M相匹配的决策树的树形图。图5为本专利技术的方法流程图。【具体实施方式】如图1所示为本专利技术的方法根据模板文档生成的D0M格式目录树的结构示意图:可以看到图中的目录树包括元素、属性和文本;如图2所示为D0M格式目录树的树形图;如图3所示为本专利技术的方法生成的与D0M格式目录树的决策树,用于辅助决策快速遍历D0M目录树;如图4所示为D0M相匹配的决策树的树形图。如图5所示为本专利技术的方法流程图: 步骤1:根据模板文档生成D0M格式目录树,并产生与之相匹配的决策树; 根据基于XML格式模板文档生成如图1所示的D0M格式目录树,包括模板文档所包含的模板文档的标题、段落、样式等属性信息,在生成D0M格式的同时产生与之相匹配的自定义标签决策树。如图2所示为D0M格式目录树的树形图;采取深度优先遍历算法,在遍历D0M格式目录树的同时按同样的树形结构生成决策树,决策树的节点同样来自D0M目录树,但是决策树的节点通过标识进行标注,标识决策树节点有无子节点,节点下有无模板标签及标签类型,当D0M目录树上节点下无模板标签,则决策树删除此节点,直到D0M目录树遍历完成,从生成完整的决策树,如图4所示。步骤2:调整优化决策树,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率; 通过改进优化决策树,包括多叉和多级调整,再结合基于D0M格式目录树的模板文档进行遍历,完成所有自定义标签数据替换和属性变更,生成完整的模板文档文件,并计算遍历D0M目录树所耗费的时间。D0M格式目录树遍历采用深度优先遍历法,从节点开始,层层深入,每进入一个子节点就与决策树进行匹配判别,当子节点不在决策树上存在,直接进入下一兄弟节点遍历,否则深入遍历,直到遍历此节点子树完成及替换自定义标签内容为止,重复此遍历过程直到遍历完成为止。步骤3:通过决策树遍历效率及模板文档生成效率筛选出最优与之D0M数据路相匹配的决策树模型; 通过比对所有调整优化决策树的模板文档DOM目录树遍历时效性,获取耗费时间最小的模型作为快速自动生成模板文档文件的辅助决策树模型。步骤4:按照筛选出的决策树模型,生成已经进行替换和属性变更的文档。【主权项】1.一种,包括如下步骤: 51.根据模板文档生成DOM格式目录树,并产生与之相匹配的决策树; 52.对步骤S1产生的决策树进行多叉和多级调整优化,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率; 53.通过决策树遍历效率及模板文档生成效率筛选出最优与之DOM数据路相匹配的决策树模型; 54.按照S3中筛选出的决策树模型,生成所需要的模板文档。2.根据权利要求1所述的,其特征在于所述的步骤S1中的产生相匹配的决策树,为在遍历DOM格式目录树的同时,按同样的树形结构生成决策树,决策树的节点来自DOM目录树,决策树的节点通过标识进行标注,标识决策树节点有无子节点,节点下有无模板标签及标签类型,且当DOM目录树上节点下无模板标签,则决策树删除此节点,直到DOM目录树遍历完成,生成完整的决策树。3.根据权利要求1或2所述的,其特征在于步骤S2中所述的遍历优化决策树,为米用深度优先算法进行遍历。4.根据权利要求1或2所述的,其特征在于步骤S4中所述的筛选出最优的决策树模型,为依据遍历时间最小原则筛选出决策树模型。5.根据权利要求3所述的,其特征在于步骤S4中所述的筛选出最优的决策树模型,为依据遍历时间最小原则筛选出决策树模型。【专利摘要】本专利技术公开了一种,包括根据模板文档生成DOM格式目录树,并产生与之相匹配的决策树;调整优化决策树,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率;通过决策树遍历效率及模板文档生成效率筛选出最优与之DOM数据路相匹配的决策树模型;按照筛选出的决策树模型,生成已经进行替换和属性变更的文档。本专利技术提供的这种,由于采用了与DOM格式目录树相匹配的决策树,并通过对决策树的筛选最终生成最优的决策树模型,并依据该决策树模型生成模板文档,因此本专利技术能够不受目录树的深度或层次的影响,能够高效、快速的生成模板文档。【IPC分类】G06F17/22【公开号】CN105426352【申请号】CN201510822691【专利技术人】徐志强, 刘正桃, 谢欣涛, 陈剑, 肖振锋 【申请人】国家电网公司, 国网湖南省电力公司, 国网湖南省电力公司经济技术研究院, 湖南天下宽信息技术有限公司【公开日】2016年3月23日【申请日】2015年11月24日本文档来自技高网...

【技术保护点】
一种模板文档自动生成方法,包括如下步骤:S1. 根据模板文档生成DOM格式目录树,并产生与之相匹配的决策树;S2. 对步骤S1产生的决策树进行多叉和多级调整优化,并遍历所有调整优化过程中的决策树获取所有决策树的遍历效率;S3. 通过决策树遍历效率及模板文档生成效率筛选出最优与之DOM数据路相匹配的决策树模型;S4. 按照S3中筛选出的决策树模型,生成所需要的模板文档。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐志强刘正桃谢欣涛陈剑肖振锋
申请(专利权)人:国家电网公司国网湖南省电力公司国网湖南省电力公司经济技术研究院湖南天下宽信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1