对话生成方法及装置制造方法及图纸

技术编号：39058338 阅读：11 留言：0更新日期：2023-10-12 19:51

本发明专利技术公开了一种对话生成方法及装置，该方法包括：接收用户输入的第一对话的问题信息；根据第一对话的问题信息检索文档知识库，得到多个第一知识文档；根据第一对话的问题信息检索第一种子数据库，得到多个第一提示样本；将第一对话的问题信息、第一知识文档和多个第一提示样本，输入大规模预训练语言模型，输出第一知识内容；根据第一对话的问题信息检索第二种子数据库，得到多个第二提示样本；将第一对话的问题信息、第一知识内容和多个第二提示样本，输入大规模预训练语言模型，输出第一对话的回复信息。本发明专利技术可以生成适用于各种对话场景的高质量对话回复信息，改善用户体验，减少样本构造，降低成本。降低成本。降低成本。

全部详细技术资料下载

【技术实现步骤摘要】
对话生成方法及装置

[0001]本专利技术涉及人工智能
，尤其涉及一种对话生成方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着深度学习技术的快速发展，对话系统在人们的日常生活的使用频率越来越高，受到了越来越多研究者、厂商和用户的关注。但是在很多真实场景中，对话系统生成的回复仍然存在很多缺陷，比如易生成一些通用的、无意义的、事实性错误的回复语句，例如“好的”、“知道了”等通用的无意义的回复，无法有效识别用户意图以及准确回答用户提出的问题，影响用户体验；
[0004]另外，在现有技术中，仍然需要大量训练数据用于训练对话系统，训练结果的好坏也严重依赖于训练数据的多样性和质量；不仅操作过程复杂、成本高，而且训练得到的对话系统缺乏通用的自然语言理解的能力，无法有效泛化到其他知识领域的对话场景中。

技术实现思路

[0005]本专利技术实施例提供一种对话生成方法，用以生成适用于各种对话场景的高质量对话回复信息，改善用户体验，减少样本构造，降低成本，方法包括：
[0006]接收用户输入的第一对话的问题信息；
[0007]根据第一对话的问题信息检索文档知识库，得到多个第一知识文档；
[0008]根据第一对话的问题信息检索第一种子数据库，得到多个第一提示样本，其中第一提示样本包括对话的问题信息，以及对话的问题信息对应的知识文档和知识内容；
[0009]...

【技术保护点】

【技术特征摘要】
1.一种对话生成方法，其特征在于，包括：接收用户输入的第一对话的问题信息；根据第一对话的问题信息检索文档知识库，得到多个第一知识文档；根据第一对话的问题信息检索第一种子数据库，得到多个第一提示样本，其中第一提示样本包括对话的问题信息，以及对话的问题信息对应的知识文档和知识内容；将第一对话的问题信息、第一知识文档和多个第一提示样本，输入大规模预训练语言模型，输出第一知识内容，所述大规模预训练语言模型是基于模仿学习策略构建的；根据第一对话的问题信息检索第二种子数据库，得到多个第二提示样本，其中第二提示样本包括对话的问题信息，以及对话的问题信息对应的知识内容和回复信息；将第一对话的问题信息、第一知识内容和多个第二提示样本，输入大规模预训练语言模型，输出第一对话的回复信息。2.如权利要求1所述的方法，其特征在于，所述多个第一知识文档与第一对话的问题信息的相关度不小于第一预设阈值；所述多个第一提示样本与第一对话的问题信息的相似度不小于第二预设阈值；所述多个第二提示样本与第一对话的问题信息的相似度不小于第三预设阈值。3.如权利要求1所述的方法，其特征在于，在接收用户输入的第一对话的问题信息之前，还包括：预先建立文档知识库，所述文档知识库中包含涉及各类知识的海量知识文档。4.如权利要求1所述的方法，其特征在于，在接收用户输入的第一对话的问题信息之前，还包括：预先建立第一种子数据库，所述第一种子数据库中包含由不同对话的问题信息，以及不同对话的问题信息对应的知识文档和知识内容组成的提示样本。5.如权利要求4所述的方法，其特征在于，根据第一对话的问题信息检索第一种子数据库，得到多个第一提示样本，包括：采用预先训练好的句子编码器，获取第一种子数据库中每个提示样本对应的向量，以及第一对话的问题信息对应的向量；计算第一种子数据库中每个提示样本对应的向量，与第一对话的问题信息对应的向量之间的余弦相似度；将计算得到的余弦相似度，作为第一种子数据库中每个提示样本与第一对话的问题信息的相似度；将第一种子数据库中与第一对话的问题信息的相似度不小于第二预设阈值的提示样本，作为第一提示样本。6.如权利要求1所述的方法，其特征在于，在接收用户输入的第一对话的问题信息之前，还包括：预先建立第二种子数据库，所述第二种子数据库中包含由不同对话的问题信息，以及不同对话的问题信息对应的知识内容和回复信息组成的提示样本。7.如权利要求6所述的方法，其特征在于，根据第一对话的问题信息检索第二种子数据库，得到多个第二提示样本，包括：采用预先训练好的句子编码器，获取第二种子数据库中每个提示样本对应的向量，以
及第一对话的问题信息对应的向量；计算第二种子数据库中每个提示样本对应的向量，与第一对话的问题信息对应的向量之间的余弦相似度；将计算得到的余弦相似度，作为第二种子数据库中每个提示样本与第一对话的问题信息的相似度；将第二种子数据库中与第一对话的问题信息的相似度不小于第三预设阈值的提示样本，作为第二提示样本。8.如权利要求1所述的方法，其特征在于，所述知识内容表征根据对话的问题信息，以及与对话的问题信息相关的知识文档推理得到的新知识。9.如权利要求1所述的方法，其特征在于，所述大规模预训练语言模型包括以下模型其中之一：GPT
‑
3模型、GLM模型或ERNIE模型。10.一种对话生成装置，其特征在于，包括：问题信息接收模块，用于接收用户输入的第一对话的问题信息；文档知识库检索模块，用于根据第一对话的问题信息检索文档知识库，得到多个第一知识文档；第一种子数据库检索模块，用于根据第一对话的问题信息检索第一种子数据库，得到多个第一提示样本，其中第一提示样本包括对话的问题信息，以及对话的问题信息对应的知识文档和知识内容；第一知识内容输出...

【专利技术属性】
技术研发人员：周婉月，
申请(专利权)人：建信金融科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人