一种确定回复语句的方法及装置制造方法及图纸

技术编号:37349520 阅读:15 留言:0更新日期:2023-04-22 21:47
本申请公开了一种确定回复语句的方法,所述方法包括:获取待回复的第一用户语句;根据所述第一用户语句,通过状态确定网络确定所述第一用户语句的第一状态信息,所述第一状态信息包括所述第一用户语句的第一对话类别,并将所述第一用户语句以及所述第一对话类别,输入至语句生成网络,得到所述第一用户语句对应的回复语句。本申请通过状态确定网络识别出用户对话的对话类别,并针对于不同的对话类型,复用对话生成网络来生成对应的回复语句,相当于可以采用同一个模型来处理不同对话类型的用户语句,降低了对话系统的模型复杂度以及模型大小。大小。大小。

【技术实现步骤摘要】
一种确定回复语句的方法及装置


[0001]本申请涉及人工智能领域,尤其涉及一种确定回复语句的方法及装置。

技术介绍

[0002]人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0003]对话系统有多种对话类型,例如闲聊型(主要面向娱乐、陪护等)、任务型(用于完成用户特定需求,例如订票、订酒店等)、问答型(给用户提供知识相关的服务,回答用户问题)等。随着深度学习的进步,对话系统取得了巨大的进步。
[0004]在现有的实现中,为了能够使得对话系统同时具备应对上述多种对话类型的用户对话,针对于每种对话类型,单独训练对应的对话模型,不同的对话模型通过集成的方式组织在一起来构造一个多功能的对话系统。然而,上述对话系统存在系统结构复杂、且占据存储空间较大的问题。

技术实现思路

[0005]本申请提供了一种确定回复语句的方法,通过状态确定网络识别出用户对话的对话类别,并针对于不同的对话类型,复用对话生成网络来生成对应的回复语句,相当于可以采用同一个模型来处理不同对话类型的用户语句,降低了对话系统的模型复杂度以及模型大小。
[0006]第一方面,本申请提供了一种确定回复语句的方法,所述方法包括:
[0007]获取待回复的第一用户语句;
[0008]在一种可能的实现中,该第一用户语句可以是用户向问答设备输入的问题、请求等文本。示例性的,用户可以采用文本形式向问答设备输入目标问题,该情况下,问答设备可以直接获取到文本形式的第一用户语句。用户还可以采用语音形式向问答设备输入目标问题,该情况下,问答设备可以将接收到的语音信息转换为文本信息,从而得到文本形式的第一用户语句。用户还可以采用肢体语言向问答设备输入目标问题,该情况下,问答设备通过对用户的肢体动作进行采集和分析,识别得到文本形式的第一用户语句。
[0009]根据所述第一用户语句,通过状态确定网络确定所述第一用户语句的第一状态信息,所述第一状态信息包括所述第一用户语句的第一对话类别,所述第一对话类别为聊天型对话、任务型对话、问答型对话或检索型对话;
[0010]其中,状态确定网络可以为训练好的,具备基于用户语句确定对应的对话类型的能力。
[0011]应理解,本申请并不限定状态确定网络需要具备识别出四种对话类别(聊天型对
话、任务型对话、问答型对话或检索型对话)的能力,状态确定网络可以具备识别出四种对话类别中至少两种的能力。
[0012]应理解,在确定对话类型时,状态确定网络的输入可以为第一用户语句(可选的,还可以包括用户的其他历史语句),这里并不限定。
[0013]应理解,上述对话类型也可以称之为对话置信状态(belief state)。
[0014]其中,聊天型对话也可以称之为闲聊型对话。
[0015]其中,状态确定网络可以为GPT模型的一部分或者完整的GPT模型,语句生成网络可以为DialoGPT模型的一部分或者完整的DialoGPT模型,语句生成网络可以为BART模型的一部分或者完整的BART模型,语句生成网络可以为T5模型的一部分或者完整的T5模型。
[0016]将所述第一用户语句以及所述第一对话类别,输入至语句生成网络,得到所述第一用户语句对应的回复语句。
[0017]在一种可能的实现中,所述语句生成网络可以为GPT模型、DialoGPT模型、BART模型或T5模型。其中,语句生成网络可以为GPT模型的一部分或者完整的GPT模型,语句生成网络可以为DialoGPT模型的一部分或者完整的DialoGPT模型,语句生成网络可以为BART模型的一部分或者完整的BART模型,语句生成网络可以为T5模型的一部分或者完整的T5模型。
[0018]可选的,本申请实施例中的状态确定网络和语句生成网络可以为同一个网络的两部分,也可以为不同的网络。
[0019]应理解,语句生成网络还可以基于除了第一用户语句之外的其他用户历史语句来生成第一用户语句的回复语句,这里并不限定。
[0020]应理解,针对于不同对话类别的用户语句,都可以作为同一个语句生成网络的输入,来得到回复语句。
[0021]本申请实施例中,通过状态确定网络识别出用户对话的对话类别,并针对于不同的对话类型,复用对话生成网络来生成对应的回复语句,相当于可以采用同一个模型来处理不同对话类型的用户语句,在模型训练时,可以通过统一多种对话类型的模式,使得多种对话类型可以同时进行训练,训练出的对话系统同时具备多种对话类型的能力,降低了对话系统的模型复杂度以及模型大小。
[0022]在一种可能的实现中,第一状态信息还可以包括槽位信息,其中,槽位信息可以为第一用户语句中的关键词。
[0023]在一种可能的实现中,所述根据所述第一用户语句,通过状态确定网络确定所述第一用户语句的第一状态信息,包括:通过状态确定网络,从多个对话类型中确定所述第一用户语句的第一对话类别,所述多个对话类型包括所述聊天型对话、任务型对话、问答型对话以及检索型对话中的至少两个。
[0024]在一种可能的实现中,可以通过状态确定网络,从多个对话类型中确定所述第一用户语句的第一对话类别,所述多个对话类型包括所述聊天型对话、任务型对话、问答型对话以及检索型对话中的至少两个。
[0025]例如,多个对话类型包括聊天型对话以及任务型对话。
[0026]例如,多个对话类型包括聊天型对话以及问答型对话。
[0027]例如,多个对话类型包括聊天型对话以及检索型对话。
[0028]例如,多个对话类型包括任务型对话以及问答型对话。
[0029]例如,多个对话类型包括任务型对话以及检索型对话。
[0030]例如,多个对话类型包括问答型对话以及检索型对话。
[0031]例如,多个对话类型包括聊天型对话、任务型对话以及问答型对话。
[0032]例如,多个对话类型包括聊天型对话、任务型对话以及检索型对话。
[0033]例如,多个对话类型包括任务型对话、问答型对话以及检索型对话。
[0034]例如,多个对话类型包括聊天型对话、任务型对话、问答型对话以及检索型对话。
[0035]本申请实施例中,针对于不同的对话类型,可以复用本申请实施例中的对话生成网络来生成对应的回复语句,在一种可能的实现中,还可以获取到待回复的第二用户语句,根据所述第二用户语句,通过所述状态确定网络确定所述第二用户语句的第二状态信息,所述第二状态信息包括所述第二用户语句的第二对话类别,所述第二对话类别为聊天型对话、任务型对话、问答型对话或检本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定回复语句的方法,其特征在于,所述方法包括:获取待回复的第一用户语句;根据所述第一用户语句,通过状态确定网络确定所述第一用户语句的第一状态信息,所述第一状态信息包括所述第一用户语句的第一对话类别,所述第一对话类别为聊天型对话、任务型对话、问答型对话或检索型对话;将所述第一用户语句以及所述第一对话类别,输入至语句生成网络,得到所述第一用户语句对应的回复语句。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一用户语句,通过状态确定网络确定所述第一用户语句的第一状态信息,包括:通过状态确定网络,从多个对话类型中确定所述第一用户语句的第一对话类别,所述多个对话类型包括所述聊天型对话、任务型对话、问答型对话以及检索型对话中的至少两个。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取待回复的第二用户语句;根据所述第二用户语句,通过所述状态确定网络确定所述第二用户语句的第二状态信息,所述第二状态信息包括所述第二用户语句的第二对话类别,所述第二对话类别为聊天型对话、任务型对话、问答型对话或检索型对话,且所述第二对话类别和所述第一对话类别不同;将所述第二用户语句以及所述第二对话类别输入至所述语句生成网络,得到所述第二用户语句对应的回复语句。4.根据权利要求1至3任一所述的方法,其特征在于,所述状态确定网络和所述语句生成网络为GPT模型、DialoGPT模型、BART模型或T5模型。5.根据权利要求1至4任一所述的方法,其特征在于,所述将所述第一用户语句以及所述第一对话类别输入至语句生成网络,得到所述第一用户语句对应的回复语句,包括:根据所述第一用户语句,从所述第一用户语句和/或数据库中得到用于构建所述回复语句所需的关键词或关键句;将所述第一用户语句、所述第一对话类别、所述关键词或关键句输入至所述语句生成网络,得到所述第一用户语句对应的回复语句。6.一种确定回复语句的方法,其特征在于,所述方法包括:获取第一用户语句、所述第一用户语句的第一对话类别以及所述第一用户语句对应的第一回复语句,所述第一对话类别为所述第一用户语句的真实类别,所述第一对话类别为聊天型对话、任务型对话、问答型对话或检索型对话;根据所述第一用户语句,通过状态确定网络确定所述第一用户语句的第一状态信息,所述第一状态信息包括所述第一用户语句的第二对话类别;将所述第一用户语句以及所述第一对话类别输入至语句生成网络,得到所述第一用户语句对应的第二回复语句;根据所述第一对话类别和所述第二对话类别之间的差异,更新所述状态确定网络;根据所述第一回复语句和所述第二回复语句之间的差异,更新所述语句生成网络。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一用户语句,通过状态确
定网络确定所述第一用户语句的第一状态信息,包括:通过状态确定网络,从多个对话类型中确定所述第一用户语句的第二对话类别,所述多个对话类型包括所述聊天型对话、任务型对话、问答型对话以及检索型对话中的至少两个。8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:获取第二用户语句、所述第二用户语句的第三对话类别以及所述第二用户语句对应的第三回复语句,所述第三对话类别为所述第二用户语句的真实类别;根据所述第二用户语句,通过所述状态确定网络确定所述第二用户语句的第二状态信息,所述第二状态信息包括所述第二用户语句的第四对话类别,所述第四对话类别和所述第三对话类别不同;将所述第二用户语句以及所述第三对话类别输入至所述语句生成网络,得到所述第二用户语句对应的第四回复语句;根据所述第四对话类别和所述第三对话类别之间的差异,更新所述状态确定网络;根据所述第四回复语句和所述第三回复语句之间的差异,更新所述语句生成网络。9.根据权利要求6至8任一所述的方法,其特征在于,所述状态确定网络和所述语句生成网络为GPT模型、DialoGPT模型、BART模型或T5模型。10.根据权利要求6至9任一所述的方法,其特征在于,所述将所述第一用户语句以及所述第一对话类别输入至语句生成网络,得到所述第一用户语句对应的第二回复语句,包括:根据所述第一用户语句,从所述第一用户语句或者数据库中得到用于构建所述回复语句所需的关键词或关键句;将所述第一用户语句、所述第一对话类别、所述关键词或关键句输入至所述语句生成网络,得到所述第一用户语句对应的第二回复语句。11.一种确定回复语句的装置,其特征在于,所述装置包括:获取模块,用于获取待回复的第一用户语句;状态生成模块,用于根据所述第一用户语句,通过状态确定网络确定所述第一用户语句的第一状态信息,所述第一状态信息包括所述第一用户语句的第一对话类别,所述第一对话类别为聊...

【专利技术属性】
技术研发人员:何彬王雅圣李一同糜飞
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1