一种确定回复语句的方法及装置制造方法及图纸

技术编号：37349520 阅读：15 留言：0更新日期：2023-04-22 21:47

本申请公开了一种确定回复语句的方法，所述方法包括：获取待回复的第一用户语句；根据所述第一用户语句，通过状态确定网络确定所述第一用户语句的第一状态信息，所述第一状态信息包括所述第一用户语句的第一对话类别，并将所述第一用户语句以及所述第一对话类别，输入至语句生成网络，得到所述第一用户语句对应的回复语句。本申请通过状态确定网络识别出用户对话的对话类别，并针对于不同的对话类型，复用对话生成网络来生成对应的回复语句，相当于可以采用同一个模型来处理不同对话类型的用户语句，降低了对话系统的模型复杂度以及模型大小。大小。大小。

全部详细技术资料下载

【技术实现步骤摘要】
一种确定回复语句的方法及装置

[0001]本申请涉及人工智能领域，尤其涉及一种确定回复语句的方法及装置。

技术介绍

[0002]人工智能(artificial intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
[0003]对话系统有多种对话类型，例如闲聊型(主要面向娱乐、陪护等)、任务型(用于完成用户特定需求，例如订票、订酒店等)、问答型(给用户提供知识相关的服务，回答用户问题)等。随着深度学习的进步，对话系统取得了巨大的进步。
[0004]在现有的实现中，为了能够使得对话系统同时具备应对上述多种对话类型的用户对话，针对于每种对话类型，单独训练对应的对话模型，不同的对话模型通过集成的方式组织在一起来构造一个多功能的对话系统。然而，上述对话系统存在系统结构复杂、且占据存储空间较大的问题。

技术实现思路

[0005]本申请提供了一种确定回复语句的方法，通过状态确定网络识别出用户对话的对话类别，并针对于不同的对话类型，复用对话生成网络来生成对应的回复语句，相当于可以采用同一个模型来处理不同对话类型的用户语句，降低了对话系统的模型复杂度以及模型大小。
[0006]...

【技术保护点】

【技术特征摘要】
1.一种确定回复语句的方法，其特征在于，所述方法包括：获取待回复的第一用户语句；根据所述第一用户语句，通过状态确定网络确定所述第一用户语句的第一状态信息，所述第一状态信息包括所述第一用户语句的第一对话类别，所述第一对话类别为聊天型对话、任务型对话、问答型对话或检索型对话；将所述第一用户语句以及所述第一对话类别，输入至语句生成网络，得到所述第一用户语句对应的回复语句。2.根据权利要求1所述的方法，其特征在于，所述根据所述第一用户语句，通过状态确定网络确定所述第一用户语句的第一状态信息，包括：通过状态确定网络，从多个对话类型中确定所述第一用户语句的第一对话类别，所述多个对话类型包括所述聊天型对话、任务型对话、问答型对话以及检索型对话中的至少两个。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：获取待回复的第二用户语句；根据所述第二用户语句，通过所述状态确定网络确定所述第二用户语句的第二状态信息，所述第二状态信息包括所述第二用户语句的第二对话类别，所述第二对话类别为聊天型对话、任务型对话、问答型对话或检索型对话，且所述第二对话类别和所述第一对话类别不同；将所述第二用户语句以及所述第二对话类别输入至所述语句生成网络，得到所述第二用户语句对应的回复语句。4.根据权利要求1至3任一所述的方法，其特征在于，所述状态确定网络和所述语句生成网络为GPT模型、DialoGPT模型、BART模型或T5模型。5.根据权利要求1至4任一所述的方法，其特征在于，所述将所述第一用户语句以及所述第一对话类别输入至语句生成网络，得到所述第一用户语句对应的回复语句，包括：根据所述第一用户语句，从所述第一用户语句和/或数据库中得到用于构建所述回复语句所需的关键词或关键句；将所述第一用户语句、所述第一对话类别、所述关键词或关键句输入至所述语句生成网络，得到所述第一用户语句对应的回复语句。6.一种确定回复语句的方法，其特征在于，所述方法包括：获取第一用户语句、所述第一用户语句的第一对话类别以及所述第一用户语句对应的第一回复语句，所述第一对话类别为所述第一用户语句的真实类别，所述第一对话类别为聊天型对话、任务型对话、问答型对话或检索型对话；根据所述第一用户语句，通过状态确定网络确定所述第一用户语句的第一状态信息，所述第一状态信息包括所述第一用户语句的第二对话类别；将所述第一用户语句以及所述第一对话类别输入至语句生成网络，得到所述第一用户语句对应的第二回复语句；根据所述第一对话类别和所述第二对话类别之间的差异，更新所述状态确定网络；根据所述第一回复语句和所述第二回复语句之间的差异，更新所述语句生成网络。7.根据权利要求6所述的方法，其特征在于，所述根据所述第一用户语句，通过状态确
定网络确定所述第一用户语句的第一状态信息，包括：通过状态确定网络，从多个对话类型中确定所述第一用户语句的第二对话类别，所述多个对话类型包括所述聊天型对话、任务型对话、问答型对话以及检索型对话中的至少两个。8.根据权利要求6或7所述的方法，其特征在于，所述方法还包括：获取第二用户语句、所述第二用户语句的第三对话类别以及所述第二用户语句对应的第三回复语句，所述第三对话类别为所述第二用户语句的真实类别；根据所述第二用户语句，通过所述状态确定网络确定所述第二用户语句的第二状态信息，所述第二状态信息包括所述第二用户语句的第四对话类别，所述第四对话类别和所述第三对话类别不同；将所述第二用户语句以及所述第三对话类别输入至所述语句生成网络，得到所述第二用户语句对应的第四回复语句；根据所述第四对话类别和所述第三对话类别之间的差异，更新所述状态确定网络；根据所述第四回复语句和所述第三回复语句之间的差异，更新所述语句生成网络。9.根据权利要求6至8任一所述的方法，其特征在于，所述状态确定网络和所述语句生成网络为GPT模型、DialoGPT模型、BART模型或T5模型。10.根据权利要求6至9任一所述的方法，其特征在于，所述将所述第一用户语句以及所述第一对话类别输入至语句生成网络，得到所述第一用户语句对应的第二回复语句，包括：根据所述第一用户语句，从所述第一用户语句或者数据库中得到用于构建所述回复语句所需的关键词或关键句；将所述第一用户语句、所述第一对话类别、所述关键词或关键句输入至所述语句生成网络，得到所述第一用户语句对应的第二回复语句。11.一种确定回复语句的装置，其特征在于，所述装置包括：获取模块，用于获取待回复的第一用户语句；状态生成模块，用于根据所述第一用户语句，通过状态确定网络确定所述第一用户语句的第一状态信息，所述第一状态信息包括所述第一用户语句的第一对话类别，所述第一对话类别为聊...

【专利技术属性】
技术研发人员：何彬，王雅圣，李一同，糜飞，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人