一种格式文档生成方法、装置、设备及存储介质制造方法及图纸

技术编号:26971280 阅读:48 留言:0更新日期:2021-01-06 00:02
本发明专利技术涉及一种格式文档生成方法、装置、设备及存储介质,所述方法包括:获取原始文档,对所述原始文档进行识别,确定所述原始文档中待填写字段区域;确定所述待填写信息区域在所述待填写字段区域中的关联信息;根据所述待填写字段生成待填写表单;获取与所述待填写表单相对应的已填写表单,提取所述已填写表单中的已填写信息;关联所述原始文档、所述关联信息以及所述已填写信息,生成新文档。本发明专利技术能够智能提取文档中需要填写的内容字段,生成对应的表单,可实现数据的自动汇总、统计,同时还能够根据填写好的表单生成完整的格式文档。

【技术实现步骤摘要】
一种格式文档生成方法、装置、设备及存储介质
本申请涉及数据处理
,尤其涉及一种格式文档生成方法、装置、设备及存储介质。
技术介绍
格式文档是指:格式相对固定,不同场景/具体事务使用时部分内容需要修改的文档。在日常生活和工作中,有大量的格式文档需要填写,如公司HR给新入职的同事填写劳动合同,房屋中介需要与房客、房东填写租房、购房合同,银行提供给贷款人员填写贷款合同,其格式固定,但是其中个人或者单位信息、合同中约定的数据各不相同。在填写这类文档时,一般做法是打印空白合同,然后给不同角色去填写,然而填写过程往往容易出错,并且事后在工作人员统计相关填写信息时,需要再根据合同内容将填写信息重新录入,从而导致信息统计的准确性和效率低下。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种格式文档生成方法、装置、设备及存储介质,能够智能提取文档中需要填写的内容字段,生成对应的表单,通过收集填写好的表单,可实现数据的自动汇总、统计,同时还能够根据填写好的表单生成完整的格式文档。为了解决上述技术问题,本专利技术实施例提供了一本文档来自技高网...

【技术保护点】
1.一种格式文档生成方法,其特征在于,包括:/n获取原始文档,对所述原始文档进行识别,确定所述原始文档中待填写字段区域,所述待填写字段区域包括待填写字段以及与所述待填写字段对应的待填写信息区域;/n确定所述待填写信息区域在所述待填写字段区域中的关联信息;/n根据所述待填写字段生成待填写表单;/n获取与所述待填写表单相对应的已填写表单,提取所述已填写表单中的已填写信息;/n关联所述原始文档、所述关联信息以及所述已填写信息,生成新文档。/n

【技术特征摘要】
1.一种格式文档生成方法,其特征在于,包括:
获取原始文档,对所述原始文档进行识别,确定所述原始文档中待填写字段区域,所述待填写字段区域包括待填写字段以及与所述待填写字段对应的待填写信息区域;
确定所述待填写信息区域在所述待填写字段区域中的关联信息;
根据所述待填写字段生成待填写表单;
获取与所述待填写表单相对应的已填写表单,提取所述已填写表单中的已填写信息;
关联所述原始文档、所述关联信息以及所述已填写信息,生成新文档。


2.根据权利要求1所述的一种格式文档生成方法,其特征在于,所述确定所述待填写信息区域在所述待填写字段区域中的关联信息包括:
对于每个待填写字段,确定与所述待填写字段对应的待填写信息区域相对于所述待填写字段的偏移位置;
确定所述待填写信息区域的上下文信息。


3.根据权利要求2所述的一种格式文档生成方法,其特征在于,所述根据所述待填写字段生成待填写表单包括:
生成空白表单;
遍历所述待填写字段,将所述待填写字段依次填充到所述空白表单中,并为每个待填写字段生成相应的填写区域及相应的格式校验属性,生成所述待填写表单;
获取所述原始文档的文档标识,将所述待填写表单与所述文档标识进行关联,建立所述待填写表单与所述文档标识的对应关系。


4.根据权利要求3所述的一种格式文档生成方法,其特征在于,所述关联所述原始文档、所述关联信息以及所述已填写信息,生成新文档包括:
根据所述待填写表单与所述文档标识的对应关系,以及所述待填写表单与所述已填写表单的对应关系,确定与所述已填写表单相对应的目标文档标识;
复制所述目标文档标识对应的原始文档,得到复制文档;
根据所述待填写信息区域相对于所述待填写字段的偏移位置,以及所述待填写信息区域的上下文信息,将所述已填写信息填充到所述复制文档的待填写信息区域中,生成所述新文档。


5.根据权利要求1所述的一种格式文档生成方法,其特征在于,所述获取原始文档,对所述原始文档进行识别,确...

【专利技术属性】
技术研发人员:张祥
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1