长文本生成方法、装置、设备及存储介质制造方法及图纸

技术编号:27772769 阅读:25 留言:0更新日期:2021-03-23 12:56
本发明专利技术涉及人工智能领域,公开了一种长文本生成方法、装置、设备及存储介质。该方法包括:获取待处理的多个关键词并将各关键词输入预置向量编码器进行向量转换,得到词向量;拼接词向量和预置变量并将得到的初始向量输入预置短句生成器进行短句生成,得到多个第一短句;分别对各第一短句进行平均池化运算并将得到的多个特征短句向量输入预置短句编码器进行编码转换,得到短句编码;将短句编码、初始向量和预置随机变量输入预置文本关联器进行特征提取,得到上下文关联向量;将各第一短句、随机变量和上下文关联向量输入预置长文本生成器进行文本生成,得到长文本。本发明专利技术能够将生成长文本的上下文关联起来,提高了长文本的连贯性。

【技术实现步骤摘要】
长文本生成方法、装置、设备及存储介质
本专利技术涉及人工智能领域,尤其涉及一种长文本生成方法、装置、设备及存储介质。
技术介绍
随着人工智能的高速发展,人工智能技术被广泛用于各个行业,同时也带动了文本生成领域的发展,利用数据直接生成文本越来越多。传统的文本生成方法可以分为三个步骤:一、内容规划;二、句子规划;三、句子实现。这三个步骤实现了该生成什么内容以及该如何生成内容。然而,传统生成文本的方法中生成的内容和如何生成对应的内容,这两个部分是根据不同步骤分别去获得,导致生成的长文本中前后文的语义不连贯,句子间缺乏关联性。
技术实现思路
本专利技术的主要目的在于解决现有文本生成效果不佳的技术问题。本专利技术第一方面提供了一种长文本生成方法,所述长文本生成方法包括:获取待处理的多个关键词,并将所述各关键词输入预置向量编码器进行向量转换,得到词向量;拼接所述词向量和预置变量,得到初始向量,并将所述初始向量输入预置短句生成器进行短句生成,得到多个第一短句;分别对所述各第一短句进行平均池化运算,得到多个特征短句向量,并将所述各特征短句向量输入预置短句编码器进行编码转换,得到短句编码;拼接所述短句编码和所述初始向量,得到第一融合向量,并将所述第一融合向量和预置随机变量输入预置文本关联器进行特征提取,得到上下文关联向量;将所述各第一短句、所述随机变量和所述上下文关联向量输入预置长文本生成器进行文本生成,得到长文本。可选的,在本专利技术第一方面的第一种实现方式中,所述向量编码器包括多个双向GRU神经网络,所述获取待处理的多个关键词,并将所述各关键词输入预置向量编码器进行向量转换,得到词向量包括:获取待处理的多个关键词;将所述关键词输入所述双向GRU神经网络进行向量转换,得到前向隐藏状态向量和后向隐藏状态向量;对所述前向隐藏状态向量和后向隐藏状态向量进行拼接,得到词向量。可选的,在本专利技术第一方面的第二种实现方式中,所述短句生成器包括多个第一单向GRU神经网络,所述将所述初始向量输入预置短句生成器进行短句生成,得到多个第一短句包括:将所述初始向量输入所述第一单向GRU神经网络进行短句生成,得到多个第一短句;调用预置休止函数,对所述第一单向GRU神经网络中的全连接层进行计算,得到隐层神经元输出值;判断所述隐层神经元输出值是否超过预置阈值;若是,则停止生成短句,并将停止生成前得到的短句作为所述第一单向GRU神经网络的输出,得到多个第一短句;若否,则继续通过所述第一单向GRU神经网络生成短句,直至所述隐层神经元输出值超过预置阈值,则停止生成短句,并将停止生成前得到的短句作为所述第一单向GRU神经网络的输出,得到多个第一短句。可选的,在本专利技术第一方面的第三种实现方式中,所述分别对所述各第一短句进行平均池化运算,得到多个特征短句向量包括:调用预置平均池化函数,分别对所述各第一短句计算平均值,得到各短句对应的多个特征值;根据所述各短句对应的多个特征值,生成多个特征短句向量。可选的,在本专利技术第一方面的第四种实现方式中,所述短句编码器包括多个第二单向GRU神经网络,所述将所述各特征短句向量输入预置短句编码器进行编码转换,得到短句编码包括:将所述各特征短句向量输入所述第二单向GRU神经网络;通过所述第二单向GRU神经网络,对所述各特征短句向量进行编码转换,得到短句编码。可选的,在本专利技术第一方面的第五种实现方式中,所述语句关联器包括多个第三单向GRU神经网络,所述拼接所述短句编码和所述初始向量,得到第一融合向量,并将所述第一融合向量和预置随机变量输入预置文本关联器进行特征提取,得到上下文关联向量包括:拼接所述短句编码和所述初始向量,得到第一融合向量;将所述第一融合向量和预置随机变量输入所述第三单向GRU神经网络进行上下文关联特征提取,得到上下文关联向量。可选的,在本专利技术第一方面的第六种实现方式中,所述长文本生成器包括多个第四单向GRU神经网络,所述将所述各第一短句、所述随机变量和所述上下文关联向量输入预置长文本生成器进行文本生成,得到长文本包括:拼接所述各第一短句、所述随机变量和所述上下文关联向量,得到第二融合向量;将所述第二融合向量输入所述第四单向GRU神经网络进行解码,得到多个第二短句;依次对所述各第二短句进行拼接,得到长文本。本专利技术第二方面提供了一种长文本生成装置,所述长文本生成装置包括:获取模块,用于获取待处理的多个关键词,并将所述各关键词输入预置向量编码器进行向量转换,得到词向量;处理模块,用于拼接所述词向量和预置变量,得到初始向量,并将所述初始向量输入预置短句生成器进行短句生成,得到多个第一短句;转换模块,用于分别对所述各第一短句进行平均池化运算,得到多个特征短句向量,并将所述各特征短句向量输入预置短句编码器进行编码转换,得到短句编码;提取模块,用于拼接所述短句编码和所述初始向量,得到第一融合向量,并将所述第一融合向量和预置随机变量输入预置文本关联器进行特征提取,得到上下文关联向量;生成模块,用于将所述各第一短句、所述随机变量和所述上下文关联向量输入预置长文本生成器进行文本生成,得到长文本。可选的,在本专利技术第二方面的第一种实现方式中,所述向量编码器包括多个双向GRU神经网络,所述获取模块具体用于:获取待处理的多个关键词;将所述关键词输入所述双向GRU神经网络进行向量转换,得到前向隐藏状态向量和后向隐藏状态向量;对所述前向隐藏状态向量和后向隐藏状态向量进行拼接,得到词向量。可选的,在本专利技术第二方面的第二种实现方式中,所述短句生成器包括多个第一单向GRU神经网络,所述处理模块具体用于:将所述初始向量输入所述第一单向GRU神经网络进行短句生成,得到多个第一短句;调用预置休止函数,对所述第一单向GRU神经网络中的全连接层进行计算,得到隐层神经元输出值;判断所述隐层神经元输出值是否超过预置阈值;若是,则停止生成短句,并将停止生成前得到的短句作为所述第一单向GRU神经网络的输出,得到多个第一短句;若否,则继续通过所述第一单向GRU神经网络生成短句,直至所述隐层神经元输出值超过预置阈值,则停止生成短句,并将停止生成前得到的短句作为所述第一单向GRU神经网络的输出,得到多个第一短句。可选的,在本专利技术第二方面的第三种实现方式中,所述转换模块还包括运算单元,所述运算单元具体用于:调用预置平均池化函数,分别对所述各第一短句计算平均值,得到各短句对应的多个特征值;根据所述各短句对应的多个特征值,生成多个特征短句向量。可选的,在本专利技术第二方面的第四种实现方式中,所述短句编码器包括多个第二单向GRU神经网络,所述转换模块还包括编码单元,所述编码单元具体用于:将所述各特征短句向量输入所述第二单向GRU神经网络;本文档来自技高网...

【技术保护点】
1.一种长文本生成方法,其特征在于,所述长文本生成方法包括:/n获取待处理的多个关键词,并将所述各关键词输入预置向量编码器进行向量转换,得到词向量;/n拼接所述词向量和预置变量,得到初始向量,并将所述初始向量输入预置短句生成器进行短句生成,得到多个第一短句;/n分别对所述各第一短句进行平均池化运算,得到多个特征短句向量,并将所述各特征短句向量输入预置短句编码器进行编码转换,得到短句编码;/n拼接所述短句编码和所述初始向量,得到第一融合向量,并将所述第一融合向量和预置随机变量输入预置文本关联器进行特征提取,得到上下文关联向量;/n将所述各第一短句、所述随机变量和所述上下文关联向量输入预置长文本生成器进行文本生成,得到长文本。/n

【技术特征摘要】
1.一种长文本生成方法,其特征在于,所述长文本生成方法包括:
获取待处理的多个关键词,并将所述各关键词输入预置向量编码器进行向量转换,得到词向量;
拼接所述词向量和预置变量,得到初始向量,并将所述初始向量输入预置短句生成器进行短句生成,得到多个第一短句;
分别对所述各第一短句进行平均池化运算,得到多个特征短句向量,并将所述各特征短句向量输入预置短句编码器进行编码转换,得到短句编码;
拼接所述短句编码和所述初始向量,得到第一融合向量,并将所述第一融合向量和预置随机变量输入预置文本关联器进行特征提取,得到上下文关联向量;
将所述各第一短句、所述随机变量和所述上下文关联向量输入预置长文本生成器进行文本生成,得到长文本。


2.根据权利要求1所述的长文本生成方法,其特征在于,所述向量编码器包括多个双向GRU神经网络,所述获取待处理的多个关键词,并将所述各关键词输入预置向量编码器进行向量转换,得到词向量包括:
获取待处理的多个关键词;
将所述关键词输入所述双向GRU神经网络进行向量转换,得到前向隐藏状态向量和后向隐藏状态向量;
对所述前向隐藏状态向量和后向隐藏状态向量进行拼接,得到词向量。


3.根据权利要求1或2所述的长文本生成方法,其特征在于,所述短句生成器包括多个第一单向GRU神经网络,所述将所述初始向量输入预置短句生成器进行短句生成,得到多个第一短句包括:
将所述初始向量输入所述第一单向GRU神经网络进行短句生成,得到多个第一短句;
调用预置休止函数,对所述第一单向GRU神经网络中的全连接层进行计算,得到隐层神经元输出值;
判断所述隐层神经元输出值是否超过预置阈值;
若是,则停止生成短句,并将停止生成前得到的短句作为所述第一单向GRU神经网络的输出,得到多个第一短句;
若否,则继续通过所述第一单向GRU神经网络生成短句,直至所述隐层神经元输出值超过预置阈值,则停止生成短句,并将停止生成前得到的短句作为所述第一单向GRU神经网络的输出,得到多个第一短句。


4.根据权利要求1所述的长文本生成方法,其特征在于,所述分别对所述各第一短句进行平均池化运算,得到多个特征短句向量包括:
调用预置平均池化函数,分别对所述各第一短句计算平均值,得到各短句对应的多个特征值;
根据所述各短句对应的多个特征值,生成多个特征短句向量。


5.根据权利要求1或4所述的长文本生成方法,其特征在于,所述短句编码器包括多个第二单向GRU神经网络,所述将所述各特征短句向量输入预置...

【专利技术属性】
技术研发人员:回艳菲王健宗吴天博
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1