文章生成方法、装置、智能设备和存储介质制造方法及图纸

技术编号:26971301 阅读:47 留言:0更新日期:2021-01-06 00:02
本申请适用于文本处理技术领域,提供了一种文章生成方法、装置、智能设备和存储介质,包括:获取起始文本;将所述起始文本输入至已训练好的文本生成模型中处理,得到所述起始文本对应的生成文本;其中,所述文本生成模型对所述起始文本的处理包括获取起始文本对应的新生成的词的概率分布,根据所述新生成的词的概率分布,确定新生成的词,并根据新生成的词更新所述起始文本,生成预备文本,在所述预备文本满足预设要求时,得到所述起始文本对应的生成文本。本申请可增强生成的文章的上下文连贯性以及逻辑性,在提高文章生成效率的同时可提高文章的质量。

【技术实现步骤摘要】
文章生成方法、装置、智能设备和存储介质
本申请涉及文本处理
,尤其涉及一种文章生成方法、装置、智能设备和存储介质。
技术介绍
随着大数据技术,自然语言处理以及其他人工智能技术的不断发展,逐渐掀起了用算法自动写作生成文章的探索和实践。写作主要考察的是语序,语法,内容和语言逻辑,基于大量优质作文数据训练而得到的文本生成模型可以自动生成优质的作文。然而,现有技术中,自动生成文本的模型生成一篇文章需要较长的时间,且生成的文章上下文连贯性和逻辑性较差,文章质量欠佳。
技术实现思路
本申请实施例提供了一种文章生成方法、装置、智能设备和存储介质,可以解决现有技术中,自动生成文本的模型生成一篇文章需要较长的时间,且生成的文章上下文连贯性和逻辑性较差,文章质量欠佳的问题。第一方面,本申请实施例提供了一种文章生成方法,包括:获取起始文本;将所述起始文本输入至已训练好的文本生成模型中处理,得到所述起始文本对应的生成文本;其中,所述文本生成模型对所述起始文本的处理包括获取起始文本对应的新生成的词的概率分布,根据所述新生成的词的概率分布,确定新生成的词,并根据新生成的词更新所述起始文本,生成预备文本,在所述预备文本满足预设要求时,得到所述起始文本对应的生成文本。在第一方面的一种可能的实现方式中,所述获取起始文本对应的新生成的词的概率分布的步骤,包括:获取所述起始文本中句子的编码信息;按预设算法对所述编码信息进行转换处理,得到所述起始文本中句子的转换处理结果;根据所述转换处理结果,得到所述起始文本对应的新生成的词的概率分布。在第一方面的一种可能的实现方式中,所述获取所述起始文本中句子的编码信息的步骤,包括:获取词嵌入矩阵和所述句子中每个词在词典中的索引,所述词嵌入矩阵是与所述词典中的词相对应的矩阵;根据所述词嵌入矩阵和所述句子中每个词在所述词典中的索引,确定所述句子的嵌入编码;获取所述句子的位置编码,所述位置编码根据所述句子中每个词的相对位置信息确定;根据所述嵌入编码与所述位置编码,确定所述句子的编码信息。在第一方面的一种可能的实现方式中,所述按预设算法对所述编码信息进行转换处理,得到所述起始文本中句子的转换处理结果的步骤,包括:基于注意力机制对所述编码信息进行转换处理,得到初始转换结果;将所述编码信息与所述初始转换处理结果作残差连接处理,得到残差连接结果;通过全连接层对所述残差连接结果进行全连接处理,得到所述起始文本中句子的转换处理结果。在第一方面的一种可能的实现方式中,所述根据所述转换处理结果,得到所述起始文本对应的新生成的词的概率分布的步骤,包括:将所述转换处理结果通过全连接层以及softmax函数进行处理,得到所述起始文本对应的新生成的词的概率分布。在第一方面的一种可能的实现方式中,所述根据所述新生成的词的概率分布,确定新生成的词,并根据新生成的词更新所述起始文本,生成预备文本的步骤,包括:根据所述新生成的词的概率分布,在词典中索引查找对应的新生成的词;将查找到的所述新生成的词添加至所述起始文本中,生成预备文本。在第一方面的一种可能的实现方式中,所述文章生成方法还包括:若所述预备文本不满足预设要求,则将所述预备文本输入至所述训练好的文本生成模型中,得到所述预备文本对应的新生成的词的概率分布;根据所述预备文本对应的新生成的词的概率分布,更新所述预备文本;判断更新后的预备文本是否满足预设要求;若不满足,则重复执行更新预备文本的步骤,直到更新的预备文本满足所述预设要求,得到生成文本。第二方面,本申请实施例提供了一种文章生成装置,包括:起始文本获取单元,用于获取起始文本;文章生成单元,用于将所述起始文本输入至已训练好的文本生成模型中处理,得到所述起始文本对应的生成文本;其中,所述文本生成模型对所述起始文本的处理包括获取起始文本对应的新生成的词的概率分布,根据所述新生成的词的概率分布,确定新生成的词,并根据新生成的词更新所述起始文本,生成预备文本,在所述预备文本满足预设要求时,得到所述起始文本对应的生成文本。第三方面,本申请实施例提供了一种智能设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的文章生成方法。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的文章生成方法。第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在智能设备上运行时,使得智能设备执行如上述第一方面所述的文章生成方法。本申请实施例中,基于输入层中的参数矩阵分解以及转换层中的参数共享,可以使本申请的文本生成模型更高效地生成作文。同时基于大量优质的作文作为训练数据,以及输入层的嵌入编码、位置编码和转换层中的多头自注意力机制,可使得本申请中的文本生成模型可以生成更连贯和更具有逻辑的文本。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的文章生成方法的实现流程图;图2是本申请实施例提供的文章生成方法中文本生成模型对所述起始文本的处理的具体实现流程图;图3是本申请实施例提供的文章生成方法中步骤S201的具体实现流程图;图4是本申请实施例提供的文章生成方法中词嵌入矩阵M的示意图;图5是本申请实施例提供的文章生成方法中步骤S202的具体实现流程图;图6是本申请另一实施例提供的文章生成方法的实现流程图;图7是本申请实施例提供的文章生成装置的结构框图;图8是本申请实施例提供的智能设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据本文档来自技高网...

【技术保护点】
1.一种文章生成方法,其特征在于,包括:/n获取起始文本;/n将所述起始文本输入至已训练好的文本生成模型中处理,得到所述起始文本对应的生成文本;其中,所述文本生成模型对所述起始文本的处理包括获取起始文本对应的新生成的词的概率分布,根据所述新生成的词的概率分布,确定新生成的词,并根据新生成的词更新所述起始文本,生成预备文本,在所述预备文本满足预设要求时,得到所述起始文本对应的生成文本。/n

【技术特征摘要】
1.一种文章生成方法,其特征在于,包括:
获取起始文本;
将所述起始文本输入至已训练好的文本生成模型中处理,得到所述起始文本对应的生成文本;其中,所述文本生成模型对所述起始文本的处理包括获取起始文本对应的新生成的词的概率分布,根据所述新生成的词的概率分布,确定新生成的词,并根据新生成的词更新所述起始文本,生成预备文本,在所述预备文本满足预设要求时,得到所述起始文本对应的生成文本。


2.根据权利要求1所述的文章生成方法,其特征在于,所述获取起始文本对应的新生成的词的概率分布的步骤,包括:
获取所述起始文本中句子的编码信息;
按预设算法对所述编码信息进行转换处理,得到所述起始文本中句子的转换处理结果;
根据所述转换处理结果,得到所述起始文本对应的新生成的词的概率分布。


3.根据权利要求2所述的文章生成方法,其特征在于,所述获取所述起始文本中句子的编码信息的步骤,包括:
获取词嵌入矩阵和所述句子中每个词在词典中的索引,所述词嵌入矩阵是与所述词典中的词相对应的矩阵;
根据所述词嵌入矩阵和所述句子中每个词在所述词典中的索引,确定所述句子的嵌入编码;
获取所述句子的位置编码,所述位置编码根据所述句子中每个词的相对位置信息确定;
根据所述嵌入编码与所述位置编码,确定所述句子的编码信息。


4.根据权利要求2所述的文章生成方法,其特征在于,所述按预设算法对所述编码信息进行转换处理,得到所述起始文本中句子的转换处理结果的步骤,包括:
基于注意力机制对所述编码信息进行转换处理,得到初始转换结果;
将所述编码信息与所述初始转换处理结果作残差连接处理,得到残差连接结果;
通过全连接层对所述残差连接结果进行全连接处理,得到所述起始文本中句子的转换处理结果。


5.根据权利要求2所述的文章生成方法,其特征在于,所述根据所述转换处理结果,得到所述起始文本对应的新生成的词的概率分布的步...

【专利技术属性】
技术研发人员:杨亿飞
申请(专利权)人:北京思源智通科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1