一种公文智能生成方法及系统技术方案

技术编号:36863205 阅读:26 留言:0更新日期:2023-03-15 18:43
本发明专利技术属于基于特定计算模型的计算机系统领域,提供了一种公文智能生成方法及系统。该方法包括,获取需要生成的公文种类和需要生成的所有主题;基于需要生成的公文种类和需要生成的第一主题,采用训练好的GPT2_Chinese模型,生成第一阶段文本;基于第一阶段文本,采用textRank算法,提取第一阶段文本概要;基于需要生成的公文种类、需要生成的第K主题和第K

【技术实现步骤摘要】
一种公文智能生成方法及系统


[0001]本专利技术属于基于特定计算模型的计算机系统领域,尤其涉及一种公文智能生成方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]目前国内外文本生成技术主要集中于基于深度学习方法的学术研究。其中基于Transformer解码器的各类模型通过海量无监督的数据预训练模型,生成的文本在上下文连贯和情感表达上超出其他模型的表现,使之成为文本生成的主要技术之一。
[0004]但是目前的生成系统存在生成种类单一、侧重主题有限和段落间关联性差的弊病。不利于公文类创作,无法满足日益增长的公文写作需求。

技术实现思路

[0005]本专利技术提供一种公文智能生成方法及系统,其结构简单,能够解决公文种类繁多,侧重主题不同和段落间关联性差的生成问题,满足用户需求。
[0006]为了实现上述目的,本专利技术采用如下技术方案:本专利技术的第一个方面提供一种公文智能生成方法。
[0007]一种公文智能生成方法,包括:获取需要生成的公文种类和需要生成的所有主题;基于需要生成的公文种类和需要生成的第一主题,采用训练好的GPT2_Chinese模型,生成第一阶段文本;基于第一阶段文本,采用textRank算法,提取第一阶段文本概要;基于需要生成的公文种类、需要生成的第K主题和第K

1阶段文本概要,采用训练好的GPT2_Chinese模型,生成第K阶段文本;基于第K阶段文本,采用textRank算法,提取第K阶段文本概要;重复文本生成和概要提取的过程,直到生成最后阶段的文本;将所有阶段的文本进行拼接,生成公文。
[0008]本专利技术的第二个方面提供一种公文智能生成系统。
[0009]一种公文智能生成系统,包括:输入模块,其被配置为:获取需要生成的公文种类和需要生成的所有主题;生成模块,其被配置为:基于需要生成的公文种类和需要生成的第一主题,采用训练好的GPT2_Chinese模型,生成第一阶段文本;基于第一阶段文本,采用textRank算法,提取第一阶段文本概要;基于需要生成的公文种类、需要生成的第K主题和第K

1阶段文本概要,采用训练好的GPT2_Chinese模型,生成第K阶段文本;基于第K阶段文本,采用textRank算法,提取第K阶段文本概要;重复文本生成和概要提取的过程,直到生成最后阶段的文本;将所有阶段的文本进行拼接,生成公文。
[0010]本专利技术的第三个方面提供一种计算机可读存储介质。
[0011]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一个方面所述的公文智能生成方法中的步骤。
[0012]本专利技术的第四个方面提供一种计算机设备。
[0013]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一个方面所述的公文智能生成方法中的步骤。
[0014]与现有技术相比,本专利技术的有益效果是:本专利技术通过增加输入模块,用户能够输入控制公文生成的条件,通过输入公文种类,能够控制生成公文的类型;通过增加主题,能够控制生成公文的段落主题,通过增加概要,能够增加生成公文段落间的关联度,通过增加生成模块,能够生成公文及概要,通过增加已训练的GPT2_Chinese模型,能够控制生成对应于用户输入的公文种类、第K主题和第K

1阶段的第K阶段文本,通过增加textRank算法,能够提取第K

1阶段的公文概要。本专利技术结构简单,能够解决公文种类繁多,侧重主题不同,同时解决段落间关联性差的生成问题,满足用户的需求。
附图说明
[0015]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0016]图1是本专利技术示出的公文智能生成方法的流程图;图2是本专利技术示出的公文智能生成系统的框架图。
具体实施方式
[0017]下面结合附图与实施例对本专利技术作进一步说明。
[0018]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0019]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0020]需要注意的是,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来
实现,或者可以使用专用硬件与计算机指令的组合来实现。
[0021]实施例一如图1所示,本实施例提供了一种公文智能生成方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器和系统,并通过终端和服务器的交互实现。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务器、云通信、中间件服务、域名服务、安全服务CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。本实施例中,该方法包括以下步骤:获取需要生成的公文种类和需要生成的所有主题;基于需要生成的公文种类和需要生成的第一主题,采用训练好的GPT2_Chinese模型,生成第一阶段文本;基于第一阶段文本,采用textRank算法,提取第一阶段文本概要;基于需要生成的公文种类、需要生成的第K主题和第K

1阶段文本概要,采用训练好的GPT2_Chinese模型,生成第K阶段文本;基于第K阶段文本,采用textRank算法,提取第K阶段文本概要;重复文本生成和概要提取的过程,直到生成最后阶段的文本;将所有阶段的文本进行拼接,生成公文。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种公文智能生成方法,其特征在于,包括:获取需要生成的公文种类和需要生成的所有主题;基于需要生成的公文种类和需要生成的第一主题,采用训练好的GPT2_Chinese模型,生成第一阶段文本;基于第一阶段文本,采用textRank算法,提取第一阶段文本概要;基于需要生成的公文种类、需要生成的第K主题和第K

1阶段文本概要,采用训练好的GPT2_Chinese模型,生成第K阶段文本;基于第K阶段文本,采用textRank算法,提取第K阶段文本概要;重复文本生成和概要提取的过程,直到生成最后阶段的文本;将所有阶段的文本进行拼接,生成公文。2.根据权利要求1所述的公文智能生成方法,其特征在于,所述GPT2_Chinese模型训练的过程包括:获取现有的公文,构建训练集和测试集;采用textRank算法,提取每个阶段现有公文的文本摘要;以现有公文的种类、主题和文本摘要为输入,以该主题对应的文本为输出,训练GPT2_ Chinese模型。3.根据权利要求2所述的公文智能生成方法,其特征在于,利用训练后的GPT2_Chinese模型对测试集中的公文的种类、主题和文本摘要进行测试,将GPT2_ Chinese模型输出的公文与测试集中的公文进行比对,优化GPT2_ Chinese模型的参数,当GPT2_Chinese模型输出的公文满足一定条件时,得到训练好的GPT2_ Chinese模型。4.根据权利要求1所述的公文智能生成方法,其特征在于,所述基于需要生成的公文种类、需要生成的第K主题和第K

1阶段文本概要,采用训练好的GPT2_ Chinese模型,生成第K阶段文本具体包括:将需要生成的公文种类、需要生成的第K主题和第K

1阶段文本概要进行拼接,输入至训练好的GPT2_ Chinese模型,生成第K阶段文本。5.一种公文智能生成系统,其特征在于,包括:输入模块,其被配置为:获取需要生成的公文种类和需要生成的所有主题;生成模块,其被配置为:基于需要生成的公文种类和需要生成的第一主题,采用训练好的GPT2_ Chinese模型,生成第一...

【专利技术属性】
技术研发人员:姜同庆张翼飞岳明田凌云韩宝申高建新高彦钊赵宁
申请(专利权)人:山东政通科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1