【技术实现步骤摘要】
信息生成模型的训练方法、生成信息的方法、装置和设备
[0001]本公开涉及人工智能领域,具体涉及自然语言处理和深度学习
,尤其涉及一种信息生成模型的训练方法、生成信息的方法、装置、电子设备和存储介质。
技术介绍
[0002]随着计算机技术和网络技术的发展,通过自然语言处理技术来生成信息的方法得到普及。为了利于信息的推广,需要考虑信息的连贯性和非重复性。
技术实现思路
[0003]本公开旨在提供一种提高所生成信息的多样性的信息生成模型的训练方法、生成信息的方法、装置、电子设备和存储介质。
[0004]根据本公开的一个方面,提供了一种信息生成模型的训练方法,包括:将信息对中针对目标对象的描述信息拆分为至少一个描述词,得到描述词序列;其中,信息对还包括第一推荐信息;将描述词序列输入对话生成模型,得到针对目标对象的概率向量序列,该概率向量序列中的每个概率向量包括针对多个预定词的概率值;以及根据概率向量序列和第一推荐信息,训练对话生成模型,得到信息生成模型。
[0005]根据本公开的一个方面,提供 ...
【技术保护点】
【技术特征摘要】
1.一种信息生成模型的训练方法,包括:将信息对中针对目标对象的描述信息拆分为至少一个描述词,得到描述词序列;其中,所述信息对还包括第一推荐信息;将所述描述词序列输入对话生成模型,得到针对所述目标对象的概率向量序列;所述概率向量序列中的每个概率向量包括针对多个预定词的概率值;以及根据所述概率向量序列和所述第一推荐信息,训练所述对话生成模型,得到所述信息生成模型。2.根据权利要求1所述的方法,还包括:将针对所述目标对象的提示信息拆分为至少一个提示词,得到提示词序列;其中,所述将所述描述词序列输入对话生成模型,得到针对所述目标对象的概率向量序列包括:将所述描述词序列和所述提示词序列输入所述对话生成模型,得到概率向量序列。3.根据权利要求2所述的方法,其中,所述概率向量序列指示针对所述目标对象的第二推荐信息;所述方法还包括:根据所述概率向量序列,确定所述第二推荐信息包括所述提示信息的预测概率;根据所述预测概率确定所述对话生成模型的第一损失值;以及根据所述第一损失值训练所述对话生成模型。4.根据权利要求3所述的方法,其中,所述根据所述概率向量序列,确定所述第二推荐信息包括所述提示信息的预测概率包括:根据所述概率向量序列中针对所述提示词序列中每个提示词的概率值,确定所述第二推荐信息包括所述每个提示词的概率;以及根据所述第二推荐信息包括所述至少一个提示词的至少一个概率,确定所述第二推荐信息包括所述提示信息的预测概率。5.根据权利要求1~4中任一项所述的方法,其中,所述概率向量序列指示针对所述目标对象的第二推荐信息;所述方法还包括:根据所述第二推荐信息与所述描述信息之间的关联关系,确定所述对话生成模型的第二损失值;以及根据所述第二损失值训练所述对话生成模型。6.根据权利要求5所述的方法,其中,所述对话生成模型包括带离散隐变量的预训练对话生成模型;所述将所述描述词序列输入对话生成模型,得到针对所述目标对象的概率向量序列包括:将随机标识信息和所述描述词序列输入所述对话生成模型,得到与所述随机标识信息对应的关联预测值及概率向量序列,其中,所述关联预测值指示所述第二推荐信息与所述描述信息之间的关联关系。7.根据权利要求1所述的方法,还包括:根据所述概率向量序列确定针对所述目标对象的第二推荐信息;响应于所述第二推荐信息中存在重复的词,根据重复的词在所述第二推荐信息中的位置信息,确定所述概率向量序列中与重复的词对应的概率向量,作为目标概率向量;根据所述目标概率向量和重复的词,确定所述对话生成模型的第三损失值;以及
根据所述第三损失值训练所述对话生成模型。8.根据权利要求1所述的方法,还包括:将所述第一推荐信息拆分为至少一个推荐词,得到推荐词序列;响应于所述推荐词序列中存在重复的词,根据重复的词在所述推荐词序列中的位置信息,确定所述概率向量序列中与重复的词对应的概率向量,作为目标概率向量;根据所述目标概率向量和重复的词,确定所述对话生成模型的第三损失值;以及根据所述第三损失值训练所述对话生成模型。9.一种生成信息的方法,包括:将待推荐对象的描述信息拆分为至少一个描述词,得到描述词序列;将所述描述词序列输入信息生成模型,得到针对所述待推荐对象的概率向量序列;所述概率向量序列中的每个概率向量包括针对多个预定词的概率值;以及根据所述概率向量序列,确定针对所述待推荐对象的推荐信息,其中,所述信息生成模型是采用权利要求1~8中任一项所述的方法训练的。10.根据权利要求9所述的方法,还包括:将针对所述待推荐对象的提示信息拆分为至少一个提示词,得到提示词序列;其中,所述将所述描述词序列输入信息生成模型,得到针对所述待推荐对象的概率向量序列包括:将所述描述词序列和所述提示词序列输入所述对话生成模型,得到所述概率向量序列。11.根据权利要求9或10所述的方法,其中,所述对话生成模型包括带离散隐变量的预训练对话生成模型;所述将所述描述词序列输入信息生成模型,得到针对所述待推荐对象的概率向量序列包括:将随机标识信息和所述描述词序列输入所述对话生成模型,得到与所述随机标识信息对应的关联值及所述概率向量序列,其中,所述关联值指示所述推荐信息与所述描述信息之间的关联关系。12.一种信息生成模型的训练装置,包括:第一拆分模块,用于将信息对中针对目标对象的描述信息拆分为至少一个描述词,得到描述词序列;其中,所述信息对还包括第一推荐信息;序列获得模块,用于将所述描述词序列输入对话生成模型,得到针对所述目标对象的概率向量序列;所述概率向量序列中的每个概率向量包括针对多个预定词的概率值;以及训练模块,用于根据所述概率向量序列和所述第一推荐信息,训练所...
【专利技术属性】
技术研发人员:雷泽阳,徐新超,吴文权,牛正雨,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。