一种基于结构化解析的公文生成方法、装置、设备及介质制造方法及图纸

技术编号:46495628 阅读:4 留言:0更新日期:2025-09-26 19:13
本申请公开了一种基于结构化解析的公文生成方法、装置、设备及介质,涉及数据处理技术领域,包括:通过预设信息输入接口,获取目标用户输入的初始公文纲要;对所述初始公文纲要中的目标非文本数据进行预处理操作,对预处理后公文纲要进行处理,以确定预处理后公文纲要对应的目标多级标题结构;基于目标多级标题结构构造相应的目标文档节点树;基于预设公文生成接口生成各文本段分别对应的公文片段,并基于目标文档节点树中各文档节点之间的层级关系,对各公文片段进行相应的整合,以生成目标公文。通过基于各标题层级生成文档节点树,并基于文档节点树依次生成公文片段,保证了公文的格式规范性。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种基于结构化解析的公文生成方法、装置、设备及介质


技术介绍

1、公文是行政机关在行政管理过程中形成的具有法定效力和规范体式的文书,是依法行政和进行公务活动的重要工具。公文通常对文档的格式具有严格要求。

2、目前的基于结构化解析的公文生成方法是利用人工智能模型直接输出完整的公文文本,这种公文生成方式存在着生成的公文存在标题序号断层,格式混乱的问题。为此,如何提高生成的公文的规范性成为目前有待解决的技术问题。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种基于结构化解析的公文生成方法、装置、设备及介质,能够通过基于各标题层级生成文档节点树,并基于文档节点树依次生成公文片段,保证了公文的格式规范性。其具体方案如下:

2、第一方面,本申请提供了一种基于结构化解析的公文生成方法,应用于预设公文生成器,包括:

3、通过预设信息输入接口,获取目标用户输入的初始公文纲要;

4、基于预先配置的与非文本格式数据对应的预处理程序,对所述初本文档来自技高网...

【技术保护点】

1.一种基于结构化解析的公文生成方法,其特征在于,应用于预设公文生成器,包括:

2.根据权利要求1所述的基于结构化解析的公文生成方法,其特征在于,所述基于预先配置的与非文本格式数据对应的预处理程序,对所述初始公文纲要中的目标非文本数据进行预处理操作,包括:

3.根据权利要求1所述的基于结构化解析的公文生成方法,其特征在于,所述利用多模式正则表达式匹配算法对所述预处理后公文纲要进行处理,以确定所述预处理后公文纲要对应的目标多级标题结构,包括:

4.根据权利要求1所述的基于结构化解析的公文生成方法,其特征在于,所述基于所述目标多级标题结构构造相应的目标文档...

【技术特征摘要】

1.一种基于结构化解析的公文生成方法,其特征在于,应用于预设公文生成器,包括:

2.根据权利要求1所述的基于结构化解析的公文生成方法,其特征在于,所述基于预先配置的与非文本格式数据对应的预处理程序,对所述初始公文纲要中的目标非文本数据进行预处理操作,包括:

3.根据权利要求1所述的基于结构化解析的公文生成方法,其特征在于,所述利用多模式正则表达式匹配算法对所述预处理后公文纲要进行处理,以确定所述预处理后公文纲要对应的目标多级标题结构,包括:

4.根据权利要求1所述的基于结构化解析的公文生成方法,其特征在于,所述基于所述目标多级标题结构构造相应的目标文档节点树,包括:

5.根据权利要求4所述的基于结构化解析的公文生成方...

【专利技术属性】
技术研发人员:成子木朱璐
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1