造句方法及造句模型训练方法、装置和计算机设备制造方法及图纸

技术编号:33796664 阅读:69 留言:0更新日期:2022-06-16 09:59
本申请涉及基于机器学习的自然语言处理,公开了一种造句及造句方法、装置、计算机设备和存储介质。由于造句模型是预先训练好的,因此,利用造句模型能够预测生成关键词对应的目标句子。一方面,利用模型生成关键词的目标句子的技术,相比较匹配检索返回句子而言,不会存在检索不到的情况,即,能够100%输出目标句子,能够满足造句需求。另一方面,利用造句模型进行预测时,通过先预测插入位置,进而预测插入位置的目标单词,再预测现有单词是否需要删除,在不需要删除即预测插入位置和目标单词符合模型目标后,才输出目标句子,能够确保输出的目标句子的准确度。的目标句子的准确度。的目标句子的准确度。

【技术实现步骤摘要】
造句方法及造句模型训练方法、装置和计算机设备


[0001]本申请涉及自然语言处理
,特别是涉及一种造句方法及造句模型训练方法、装置、计算机设备和存储介质。

技术介绍

[0002]造句,是指给定几个关键词,按照一定的句法规则造出字词通顺、意思完整、符合逻辑的句子。
[0003]传统技术是通过检索实现造句,即先搭好一个庞大的语料库,然后从语料库里面检索与匹配输入的单词或者词组,从而得到一条或多条包含该单词或者词组的句子。然而,通过检索来造句很大程度上依赖于语料库,若语料库中不存在匹配的单词时,则无法实现造句功能。
[0004]即,现有的造句方法,不能满足造句需求。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够满足造句需求的造句方法及造句模型训练方法、装置、计算机设备和存储介质。
[0006]一种造句方法,所述方法包括:
[0007]获取关键词;
[0008]利用训练好的造句模型预测所述关键词的目标句子,其中,通过所述造句模型预测所述关键词前后需要插入单词的数量得本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种造句方法,所述方法包括:获取关键词;利用训练好的造句模型预测所述关键词的目标句子,其中,通过所述造句模型预测所述关键词前后需要插入单词的数量得到插入位置,预测各插入位置的目标单词,得到第一候选句子,预测所述第一候选句子需要删除的单词,得到第二候选句子,若所述第一候选句子与所述第二候选句子相同,则输出得到目标句子。2.根据权利要求1所述的方法,所述利用训练好的造句模型预测所述关键词的目标句子,包括:将所述关键词对应的关键词序列输入到所述造句模型的句子结构预测网络,预测关键词前后需要插入单词的数量得到插入位置,根据所述关键词序列和所述插入位置,得到第一句序列;将所述第一句序列输入到所述造句模型的单词预测网络,预测各插入位置的目标单词,根据所述第一句序列和所述目标单词,得到第一候选句子;将所述第一候选句子输入到所述句子结构预测网络,预测所述第一候选句子需要删除的单词,得到第二候选句子;若预测的所述第一候选句子与所述第二候选句子相同,则输出得到目标句子。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述第一候选句子与所述第二候选句子不同,则根据所述第三候选句子的各词更新关键词;迭代执行所述利用训练好的造句模型预测所述关键词的目标句子的步骤,直至所述第一候选句子与所述第二候选句子相同,则输出得到目标句子。4.一种造句模型训练方法,包括:获取训练数据集,所述训练数据集包括关键词,以及各关键词对应的标注句子;利用造句模型预测所述关键词的目标句子,其中,通过所述造句模型预测所述关键词前后需要插入单词的数量得到插入位置,预测各插入位置的目标单词,得到第一候选句子,预测所述候选句子是否删除单词,得到第二候选句子,若所述第一候选句子与所述第二候选句子相同,则输出得到目标句子;根据预测的所述目标句子和所述标注句子,对所述造句模型的参数进行调整;迭代进行训练,得到训练好的造句模型。5.根据权利要求1所述的方法,其特征在于,利用训练好的造句模型预测所述关键词的目标句子,包括:将所述关键词对应的关键词序列输入到所述造句模型的句子结构预测网络,预测关键词前后需要插入单词的数量得到插入位置,根据所述关键词序列和所述插入位置,得到第一句序列;将所述第一句序列输入到所述造句模型的单词预测网络,预测各插入位置的目标单词,根据所述第一句序列和所述目标单词,得到第一候选句子;将所述第一候选句子输入到所述句子结构预测网络,预测所述第一候选句子需要删除的单词,得到第二候选句子;若预测的所述第一候选句子与所述第二候选句子相同,则输出得到目标句子。6.根据权利要求5所述的方法,其特征在于,所述单词预测网络采用序列到序列的模型
网络,包括编码器和解码器;将所述第一句序列输入到所述造句模型的单词预测网络,预测各插入位置的目标单词,根据所述第一句序列和所述目标单词,得到第一候选句子,包括:将所述第一句序列输入到所述单词预测网络的编码器;将所述编码器的输出输入至所述的解码器,所述解码器的输入还包括从所述关键词对...

【专利技术属性】
技术研发人员:陈松灿
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1