回复信息的确定方法、装置、设备及计算机存储介质制造方法及图纸

技术编号：38202427 阅读：13 留言：0更新日期：2023-07-21 16:46

本申请公开了一种回复信息的确定方法、装置、设备及计算机存储介质。该方法包括：获取问题信息；将所述问题信息输入至预先训练好的生成模型，通过所述预先训练好的生成模型确定所述问题信息的回复信息；将所述回复信息输入至二分类判别器，在所述二分类判别器输出的判定结果为第一指示信息的情况下，在语料库中检索与所述问题信息有预设相似度的目标问题信息；计算所述回复信息与所述目标问题信息对应的目标回复信息的相似度；在所述相似度大于目标值的情况下，输出所述相似度最高的回复信息。如此改善了回复的不可控性，提高了回复的可靠性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
回复信息的确定方法、装置、设备及计算机存储介质

[0001]本申请属于人工智能领域，尤其涉及一种回复信息的确定方法、装置、设备及计算机存储介质。

技术介绍

[0002]现有闲聊模块通常使用检索或者生成方式获取问题的回复，检索方式一般是通过在已有的语料数据库中检索，检索出与用户问题相似的问题，然后将该相似问题的回复返回给用户，生成方式一般是通过生成模型(如GPT3、T5、Bart等)生成问题的回复，基于训练好的生成模型，在推理时对用户输入的问题自动生成回复。通过检索相似问题获取的回复，或者通过生成模型生成的回复很容易使得回复并不是用户想要得到的回复，如此得到的回复具有不可控性，进而导致回复的可靠性较低。

技术实现思路

[0003]本申请实施例提供一种在回复信息的确定方法、装置、设备及计算机存储介质，能够改善回复的不可控性，提高回复的可靠性。
[0004]第一方面，本申请实施例提供一种回复信息的确定方法，方法包括：
[0005]获取问题信息；
[0006]将问题信息输入至预先训练好的生成模...

【技术保护点】

【技术特征摘要】
1.一种回复信息的确定方法，其特征在于，包括：获取问题信息；将所述问题信息输入至预先训练好的生成模型，通过所述预先训练好的生成模型确定所述问题信息的回复信息，所述生成模型为按照输入的问题信息生成对应的回复信息的模型，所述回复信息至少包括一条；将所述回复信息输入至二分类判别器，在所述二分类判别器输出的判定结果为第一指示信息的情况下，在语料库中检索与所述问题信息有预设相似度的目标问题信息；计算所述回复信息与所述目标问题信息对应的目标回复信息的相似度；在所述相似度大于目标值的情况下，输出所述相似度最高的回复信息。2.根据权利要求1所述的回复信息的确定方法，其特征在于，还包括：在所述相似度不大于目标值的情况下，输出预定回复信息。3.根据权利要求1所述的回复信息的确定方法，其特征在于，还包括：在所述二分类判别器输出的判定结果为第二指示信息的情况下，输出预定回复信息。4.根据权利要求1所述的回复信息的确定方法，其特征在于，在将所述问题信息输入至预先训练好的生成模型之前，所述方法还包括：获取多轮次语料信息，所述语料信息包括问题信息样本和回复信息样本；将所述多轮次语料信息输入至所述生成模型中，通过所述生成模型得到预测回复信息；在所述预测回复信息与真实回复信息之间的误差在预设范围内的情况下，得到训练好的生成模型。5.根据权利要求4所述的回复信息的确定方法，其特征在于，所述多轮次语料信息为至少两组多轮次语料信息，在将所述回复信息输入至二分类判别器之前，所述方法还包括：获取所述至少两组多轮次语料信息的轮次，其中，一个轮次的语料信息包括一个问题信息和一个回复信息；在所述轮次大于预定阈值的情况下，利用同一组的多轮次语料信息按照第一预定规则构造正样本，利用至少两组多轮次语料信息按照第二预定规则构造负样本，对初始二分类判别器进行训练，得到所述二分类判别器，所述第一预定规则为每条样本增...

【专利技术属性】
技术研发人员：赵康辉，黄彩云，周佳，白国涛，孙昊，张毅，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人