文档合并方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38538424 阅读:22 留言:0更新日期:2023-08-19 17:07
本申请涉及数据处理技术领域,提供了一种文档合并方法、装置、计算机设备、存储介质和计算机程序产品,可具体应用于金融领域、大数据领域或其他相关领域。本申请能够实现提高文档合并的效率和准确性。该方法包括:确定各待合并的文档实例的文档模板;根据各待合并的文档实例的文档模板确定目标文档模板;分别从各待合并的文档实例的实例章节节点中,确定出与模板章节节点匹配的实例章节节点,作为目标实例章节节点;根据目标实例章节节点,将各待合并的文档实例中属于同一个目标实例章节节点下的章节内容进行融合处理,得到融合内容;分别将融合内容添加至初始文档实例中与各目标实例章节节点匹配的模板章节节点下,得到目标文档实例。档实例。档实例。

【技术实现步骤摘要】
文档合并方法、装置、计算机设备和存储介质


[0001]本申请涉及数据处理
,特别是涉及一种文档合并方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着信息技术的发展,各领域正进行数字化转型的深入推进,很多机构依托文档技术,搭建内部在线协同研发平台,实现机构知识的结构化存储和共享,例如业务需求书、测试方案、投产方案文档的结构化协同编写。为满足各领域的最新要求,如何将编写的各文档进行合并成为了重要的研究方向。
[0003]传统技术通常是对各待合并的文档进行人工审阅,根据人工审阅的结果,将各待合并的文档进行人工的手动拼接;但是,该方式主要通过人工拼接的方式逐一合并文档内容,导致文档合并的效率较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种文档合并方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种文档合并方法。所述方法包括:
[0006]确定各待合并的文档实例对应的文档模板;
[0007]根据所述各本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文档合并方法,其特征在于,所述方法包括:确定各待合并的文档实例对应的文档模板;根据所述各待合并的文档实例对应的文档模板,确定目标文档模板;所述目标文档模板中包含模板章节节点;分别从所述各待合并的文档实例的实例章节节点中,确定出与所述模板章节节点匹配的实例章节节点,作为所述各待合并的文档实例的目标实例章节节点;根据所述各待合并的文档实例的目标实例章节节点,将所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容进行融合处理,得到各所述目标实例章节节点的融合内容;分别将各所述目标实例章节节点的融合内容,添加至初始文档实例中与各所述目标实例章节节点匹配的模板章节节点下,得到所述初始文档实例对应的目标文档实例;所述初始文档实例为根据目标文档模板生成的文档实例。2.根据权利要求1所述的方法,其特征在于,所述根据所述各待合并的文档实例的目标实例章节节点,将所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容进行融合处理,得到各所述目标实例章节节点的融合内容,包括:根据所述各待合并的文档实例的目标实例章节节点,确定所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容之间的相似度;根据所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容之间的相似度,将所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容进行融合处理,得到各所述目标实例章节节点的融合内容。3.根据权利要求2所述的方法,其特征在于,所述根据所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容之间的相似度,将所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容进行融合处理,得到各所述目标实例章节节点的融合内容,包括:根据所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容之间的相似度,在所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容中,确定出所述各待合并的文档实例中属于同一个目标实例章节节点下的重复章节内容和非重复章节内容;在所述各待合并的文档实例中属于同一个目标实例章节节点下的重复章节内容中,确定出所述各待合并的文档实例中属于同一个目标实例章节节点下的最新的重复章节内容;将所述各待合并的文档实例中属于同一个目标实例章节节点下的最新的重复章节内容和所述非重复章节内容进行融合处理,得到各所述目标实例章节节点的融合内容。4.根据权利要求1所述的方法,其特征在于,所述根据所述各待合并的文档实例的目标实例章节节点,将所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容进行融合处理,得到各所述目标实例章节节点的融合内容,还包括:根据所述各待合并的文档实例的目标实例章节节点,确定所述各待合并的文档实例中属于同一个目标实例章节节点下的章节内容的内容类型;从预设融合模型中,确定出所述内容类型对应的融合模型;利用所述内容类型对应的融合模型,将所述各待合并的文档实例中属于同一...

【专利技术属性】
技术研发人员:石忠德叶齐娇姜子玉阙梦婕
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1