【技术实现步骤摘要】
基于集束搜索的句子生成方法、装置、设备及存储介质
[0001]本申请涉及人工智能中的智能决策
,尤其涉及一种基于集束搜索的句子生成方法、装置、计算机设备及存储介质
技术介绍
[0002]集束搜索通常被用于神经网络机器翻译领域,将源语言(source language)的句子翻译成目标语言(target language)的句子。目标语言句子中每个字的生成,便是通过集束搜索方法,选择最有可能,即概率最大的k个候选,k为超参数,需要用户自定设定。
[0003]现有的集束搜索在每一步生成的时候仅依照概率选择最有可能的k个候选,直至最终k个完整句子的生成,再从里面选择概率分数最高的那个最为最终的结果。
[0004]然而,申请人发现,传统的集束搜索方法生成的结果可能未包含部分关键信息,就不能够满足用户的需求。抑或是某些时候,用户想额外添加自己想要添加字或者短语,现有的集束搜索方法也并不能满足,由此可见,传统的集束搜索方法无法满足定向生成的问题。
技术实现思路
[0005]本申请实施例的目的在于提出一种基于集束搜索的句子生成方法、装置、计算机设备及存储介质,以解决传统的集束搜索方法无法满足定向生成的问题。
[0006]为了解决上述技术问题,本申请实施例提供一种基于集束搜索的句子生成方法,采用了如下所述的技术方案:
[0007]接收用户终端发送的句子生成请求,其中,所述句子生成请求至少携带有起始字词以及N个目标字词,N为大于等于1的整数;
[0008]以所述起始字词为首 ...
【技术保护点】
【技术特征摘要】
1.一种基于集束搜索的句子生成方法,其特征在于,包括下述步骤:接收用户终端发送的句子生成请求,其中,所述句子生成请求至少携带有起始字词以及N个目标字词,N为大于等于1的整数;以所述起始字词为首,并根据所述目标字词构建第一结构组合、第二结构组合以及第三结构组合,其中,所述第一结构组合完全包含所述N个目标字词,所述第二结构组合包含M个所述目标字词,所述第三结构组合不包含所述N个目标字词,M为大于等于1且小于N的整数;在长短期记忆网络的解码器模块中,分别对所述第一结构组合、所述第二结构组合以及所述第三结构组合进行单词预测操作,选取每个时间步长中概率最大的单词作为最佳候选单词集;根据集束搜索算法分别在所述最佳候选单词集中选择最大概率分布的单词构成句子,得到第一结构生成句子、第二结构生成句子以及第三结构生成句子;根据预设筛选规则对所述第一结构生成句子、第二结构生成句子以及第三结构生成句子进行筛选操作,得到目标生成句子。2.根据权利要求1所述的基于集束搜索的句子生成方法,其特征在于,所述根据集束搜索算法分别在所述最佳候选单词集中选择最大概率分布的单词构成句子,得到第一结构生成句子、第二结构生成句子以及第三结构生成句子的步骤,具体包括下述步骤:在每个结构组合对应的最佳候选单词集中,在第一个时间步长,选取当前条件概率最大的k个词,将k个词作为候选输出序列,之后每个时间步长,基于上个步长的输出序列,挑选出所有序列中条件概率最大的k个,最后从k个候选中挑选出最优的组合成为最终的生成句子。3.根据权利要求2所述的基于集束搜索的句子生成方法,其特征在于,所述条件概率表示为:p(y
<2>
,y
<1>
|x)=p(y
<z>
|y
<1>
,x)p(y
<1>
|x)其中,y
<2>
表示第二个单词的条件概率输出;y
<1>
表示当前单词;x表示上一个时间。4.根据权利要求1所述的基于集束搜索的句子生成方法,其特征在于,所述根据预设筛选规则对所述第一结构生成句子、第二结构生成句子以及第三结构生成句子进行筛选操作,得到目标生成句子的步骤,包括下述步骤:根据所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子中各个组成单词的概率值计算所述第一结构生成句子、第二结构生成句子以及第三结构生成句子的句子概率;在所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子中筛选句子概率最大的生成句子,作为所述目标生成句子。5.根据权利要求1所述的基于集束搜索的句子生成方法,其特征在于,所述根据预设筛选规则对所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子进行筛选操作,得到目标生成句子的步骤,包括下述步骤:分别对所述第一结构生成句子、所述第二结构生成句子以及所述第三结构生成句子进行向量表示,得到第一结构字符矩阵、第二结构字符矩阵以及第三结构字符矩阵;将所述第一结构字符矩阵、所述第二结构字符矩阵以及所述第三结构字符矩阵分别输
入预先建立的句子连贯性模型,得到所述第一结构...
【专利技术属性】
技术研发人员:谯轶轩,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。