基于集束搜索的句子生成方法、装置、设备及存储介质制造方法及图纸

技术编号:39042831 阅读:9 留言:0更新日期:2023-10-10 11:55
本申请实施例属于人工智能中的智能决策技术领域,涉及一种基于集束搜索的句子生成方法、装置、计算机设备及存储介质,该方法在接收到句子生成请求后,以起始字词为首,并根据目标字词构建结构组合,并对结构组合进行单词预测操作,选取每个时间步长中概率最大的单词作为最佳候选单词集;在最佳候选单词集中选择最大概率分布的单词构成句子,得到结构生成句子;对结构生成句子进行筛选操作,得到目标生成句子。本申请引入先验知识的集束搜索方法可以让用户优雅的引入外部知识做文本生成,一方面是使得文本的生成更加的可控,另一方面对于某些专业的词汇,模型可能从来都没见过,通过用户直接提供极大程度的提高了翻译的准确度。用户直接提供极大程度的提高了翻译的准确度。用户直接提供极大程度的提高了翻译的准确度。

【技术实现步骤摘要】
基于集束搜索的句子生成方法、装置、设备及存储介质


[0001]本申请涉及人工智能中的智能决策
,尤其涉及一种基于集束搜索的句子生成方法、装置、计算机设备及存储介质

技术介绍

[0002]集束搜索通常被用于神经网络机器翻译领域,将源语言(source language)的句子翻译成目标语言(target language)的句子。目标语言句子中每个字的生成,便是通过集束搜索方法,选择最有可能,即概率最大的k个候选,k为超参数,需要用户自定设定。
[0003]现有的集束搜索在每一步生成的时候仅依照概率选择最有可能的k个候选,直至最终k个完整句子的生成,再从里面选择概率分数最高的那个最为最终的结果。
[0004]然而,申请人发现,传统的集束搜索方法生成的结果可能未包含部分关键信息,就不能够满足用户的需求。抑或是某些时候,用户想额外添加自己想要添加字或者短语,现有的集束搜索方法也并不能满足,由此可见,传统的集束搜索方法无法满足定向生成的问题。

技术实现思路

[0005]本申请实施例的目的在于提出一种基于集束搜索的句子生成方法、装置、计算机设备及存储介质,以解决传统的集束搜索方法无法满足定向生成的问题。
[0006]为了解决上述技术问题,本申请实施例提供一种基于集束搜索的句子生成方法,采用了如下所述的技术方案:
[0007]接收用户终端发送的句子生成请求,其中,所述句子生成请求至少携带有起始字词以及N个目标字词,N为大于等于1的整数;
[0008]以所述起始字词为首,并根据所述目标字词构建第一结构组合、第二结构组合以及第三结构组合,其中,所述第一结构组合完全包含所述N个目标字词,所述第二结构组合包含M个所述目标字词,所述第三结构组合不包含所述N个目标字词,M为大于等于1且小于N的整数;
[0009]在长短期记忆网络的解码器模块中,分别对所述第一结构组合、所述第二结构组合以及所述第三结构组合进行单词预测操作,选取每个时间步长中概率最大的单词作为最佳候选单词集;
[0010]根据集束搜索算法分别在所述最佳候选单词集中选择最大概率分布的单词构成句子,得到第一结构生成句子、第二结构生成句子以及第三结构生成句子;
[0011]根据预设筛选规则对所述第一结构生成句子、第二结构生成句子以及第三结构生成句子进行筛选操作,得到目标生成句子。
[0012]进一步的,所述根据集束搜索算法分别在所述最佳候选单词集中选择最大概率分布的单词构成句子,得到第一结构生成句子、第二结构生成句子以及第三结构生成句子的步骤,具体包括下述步骤:
[0013]在每个结构组合对应的最佳候选单词集中,在第一个时间步长,选取当前条件概
率最大的k个词,将k个词作为候选输出序列,之后每个时间步长,基于上个步长的输出序列,挑选出所有序列中条件概率最大的k个,最后从k个候选中挑选出最优的组合成为最终的生成句子。
[0014]进一步的,所述条件概率表示为:
[0015]P(y
<2>
,y
<1>
|x)=P(y
<2>
|y
<1>
,x)P(y
<1>
|x)
[0016]其中,y
<2>
表示第二个单词的条件概率输出;y
<1>
表示当前单词;x表示上一个时间。
[0017]进一步的,所述根据预设筛选规则对所述第一结构生成句子、第二结构生成句子以及第三结构生成句子进行筛选操作,得到目标生成句子的步骤,包括下述步骤:
[0018]根据所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子中各个组成单词的概率值计算所述第一结构生成句子、第二结构生成句子以及第三结构生成句子的句子概率;
[0019]在所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子中筛选句子概率最大的生成句子,作为所述目标生成句子。
[0020]进一步的,所述根据预设筛选规则对所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子进行筛选操作,得到目标生成句子的步骤,包括下述步骤:
[0021]分别对所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子进行向量表示,得到第一结构字符矩阵、第二结构字符矩阵以及第三结构字符矩阵;
[0022]将所述第一结构字符矩阵、所述第二结构字符矩阵以及所述第三结构字符矩阵分别输入预先建立的句子连贯性模型,得到所述第一结构字符矩阵、所述第二结构字符矩阵以及所述第三结构字符矩阵对应的句子连贯性向量,其中,所述句子连贯性模型是根据样本数据,以及样本数据对应的句子连贯性结果进行训练得到的,所述句子连贯性向量为一个二维向量,该二维向量中的元素包括:句子连贯的概率和句子不连贯的概率;
[0023]根据所述句子连贯性向量,得到所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子的句子连贯性结果,其中,所述句子连贯性结果为句子连贯或句子不连贯;
[0024]将句子连贯性结果为句子连贯的生成句子作为所述目标生成句子。
[0025]进一步的,在所述将所述第一结构字符矩阵、所述第二结构字符矩阵以及所述第三结构字符矩阵分别输入预先建立的句子连贯性模型,得到所述第一结构字符矩阵、所述第二结构字符矩阵以及所述第三结构字符矩阵对应的句子连贯性向量的步骤之前,还包括下述步骤:
[0026]获取句子连贯的正样本数据和句子不连贯的负样本数据,其中,所述正样本数据和所述负样本数据分别具有对应的句子连贯性向量;
[0027]分别对所述正样本数据和所述负样本数据进行向量表示,得到所述正样本数据的字符矩阵和所述负样本数据的字符矩阵;通过卷积神经网络对所述正样本数据的字符矩阵、所述正样本数据对应的句子连贯性向量,以及所述负样本数据的字符矩阵、所述负样本数据对应的句子连贯性向量进行训练,得到所述句子连贯性模型。
[0028]进一步的,所述根据所述句子连贯性向量,得到所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子的句子连贯性结果的步骤,具体包括下述步骤:
[0029]将所述句子连贯性向量中元素概率最高值对应的句子连贯性结果确定为所述第
一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子的句子连贯性结果,其中,所述句子连贯性向量中元素对应的句子连贯性结果包括:句子连贯和句子不连贯。
[0030]为了解决上述技术问题,本申请实施例还提供一种基于集束搜索的句子生成装置,采用了如下所述的技术方案:
[0031]请求接收模块,用于接收用户终端发送的句子生成请求,其中,所述句子生成请求至少携带有起始字词以及N个目标字本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集束搜索的句子生成方法,其特征在于,包括下述步骤:接收用户终端发送的句子生成请求,其中,所述句子生成请求至少携带有起始字词以及N个目标字词,N为大于等于1的整数;以所述起始字词为首,并根据所述目标字词构建第一结构组合、第二结构组合以及第三结构组合,其中,所述第一结构组合完全包含所述N个目标字词,所述第二结构组合包含M个所述目标字词,所述第三结构组合不包含所述N个目标字词,M为大于等于1且小于N的整数;在长短期记忆网络的解码器模块中,分别对所述第一结构组合、所述第二结构组合以及所述第三结构组合进行单词预测操作,选取每个时间步长中概率最大的单词作为最佳候选单词集;根据集束搜索算法分别在所述最佳候选单词集中选择最大概率分布的单词构成句子,得到第一结构生成句子、第二结构生成句子以及第三结构生成句子;根据预设筛选规则对所述第一结构生成句子、第二结构生成句子以及第三结构生成句子进行筛选操作,得到目标生成句子。2.根据权利要求1所述的基于集束搜索的句子生成方法,其特征在于,所述根据集束搜索算法分别在所述最佳候选单词集中选择最大概率分布的单词构成句子,得到第一结构生成句子、第二结构生成句子以及第三结构生成句子的步骤,具体包括下述步骤:在每个结构组合对应的最佳候选单词集中,在第一个时间步长,选取当前条件概率最大的k个词,将k个词作为候选输出序列,之后每个时间步长,基于上个步长的输出序列,挑选出所有序列中条件概率最大的k个,最后从k个候选中挑选出最优的组合成为最终的生成句子。3.根据权利要求2所述的基于集束搜索的句子生成方法,其特征在于,所述条件概率表示为:p(y
<2>
,y
<1>
|x)=p(y
<z>
|y
<1>
,x)p(y
<1>
|x)其中,y
<2>
表示第二个单词的条件概率输出;y
<1>
表示当前单词;x表示上一个时间。4.根据权利要求1所述的基于集束搜索的句子生成方法,其特征在于,所述根据预设筛选规则对所述第一结构生成句子、第二结构生成句子以及第三结构生成句子进行筛选操作,得到目标生成句子的步骤,包括下述步骤:根据所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子中各个组成单词的概率值计算所述第一结构生成句子、第二结构生成句子以及第三结构生成句子的句子概率;在所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子中筛选句子概率最大的生成句子,作为所述目标生成句子。5.根据权利要求1所述的基于集束搜索的句子生成方法,其特征在于,所述根据预设筛选规则对所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子进行筛选操作,得到目标生成句子的步骤,包括下述步骤:分别对所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子进行向量表示,得到第一结构字符矩阵、第二结构字符矩阵以及第三结构字符矩阵;将所述第一结构字符矩阵、所述第二结构字符矩阵以及所述第三结构字符矩阵分别输
入预先建立的句子连贯性模型,得到所述第一结构...

【专利技术属性】
技术研发人员:谯轶轩
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1