自动回复对话方法、系统及存储介质技术方案

技术编号：26924036 阅读：33 留言：0更新日期：2021-01-01 22:48

本发明专利技术公开了一种自动回复对话方法、系统及存储介质，涉及了一种新的自动回复对话模型，针对传统模型倾向于生成万能回复以及上下文无关回复的问题，TBERT首先利用BERT模型学习出问句的主题信息，然后将主题信息引入到回复生成模块中，降低万能回复以及前后矛盾回复出现的可能性，进而提高开放域对话系统的性能。

全部详细技术资料下载

【技术实现步骤摘要】
自动回复对话方法、系统及存储介质
本专利技术涉及开放域对话系统
，特别涉及一种自动回复对话方法、系统及存储介质。
技术介绍
智能对话系统是人工智能领域的一个重要研究方向，该系统能够实现让人与机器通过自然语言进行交互。当前，根据应用场景的不同，智能对话系统可以分为以下两种：一种是任务型对话系统，另一种是开放域对话系统。任务型对话系统以特定任务为导向，用户使用这类对话系统可以解决特定领域的特定问题，例如：预定机票、预订酒店、网站客服、车载助手等。开放域对话系统则不限制用户提问的特定领域，没有明确目的的对话系统都可以归入此类中，例如：微软的聊天机器人小冰，Zo等。相比于任务型对话系统，开放域对话系统的优势在于其能够拉近用户和对话系统间的距离，可以用于情感陪伴等任务型对话系统无法完成的任务。传统的开放域对话系统主要采用基于检索的方法。这类方法首先定义问题与回复之间的索引，当用户发出询问时，对话系统利用语料库中的索引输出该问题对应的回复。然而，该类方法非常依赖对话语料库的质量，如果所使用对话语料噪声大，则无论模型优劣其回复都不尽人意。并且，这类对话系统回复内容单一，对于用户的问题，只能在语料库中搜索回复，如果语料库中没有对应的回复，系统则无法做出响应。近年来，基于生成模型的开放域对话系统取得了较大进展。这类方法首先利用序列到序列模型对对话语料库数据进行学习，然后基于深度学习模型自动生成回复内容。与基于检索的方法相比，这类方法对于用户提出的问题可以产生新的回复，具有更广泛的应用领域，已经受到了学术界和工业界的共同关...

【技术保护点】
1.一种自动回复对话方法，其特征在于，包括如下步骤：/nS1，提供一对话语料数据集，对所述对话语料数据集进行关键词提取，得到对话集合；/nS2，依据TBERT模型对所述对话集合进行编码处理，生成主题向量，所述主题向量经函数处理得到主题词；/nS3，将所述主题词引入到开放域对话系统模型中，生成回复信息。/n

【技术特征摘要】
1.一种自动回复对话方法，其特征在于，包括如下步骤：
S1，提供一对话语料数据集，对所述对话语料数据集进行关键词提取，得到对话集合；
S2，依据TBERT模型对所述对话集合进行编码处理，生成主题向量，所述主题向量经函数处理得到主题词；
S3，将所述主题词引入到开放域对话系统模型中，生成回复信息。

2.根据权利要求1所述的自动回复对话方法，其特征在于，所述S1中所述关键词提取为剔除介词、冠词及修饰词。

3.根据权利要求1所述的自动回复对话方法，其特征在于，所述S2具体包括以下步骤：
S21，依据TBERT模型对所述对话集合进行向量化处理，得到字符向量；
S22，依据TBERT模型的自注意力机制及多头注意力机制对所述字符向量进行编码处理，得到所述字符向量的隐藏状态；
S23，将所述字符向量的隐藏状态的第一个字符作为问句向量，所述问句向量通过主题输入矩阵和主题输出矩阵处理得到主题向量；
S24，将所述主题向量通过函数处理来预测对话集合中的每个词，得到对话集合对应的主题词。

4.根据权利要求1所述的自动回复对话方法，其特征在于，所述S3中的所述开放域对话系统模型包括编码器及解码器，所述编码器与所述解码器由两个带门控循环单元的循环神经网络组成。

5.根据权利要求4所述的自动回复对话方法，其特征在于，所述S3具体包括以下步骤：
S31，将所述主题词引入到开放域对话系统模型中，所述编码器通过双向GRU将所述对话集合编码呈隐藏状态；
S32，所述门控单元将所述主题向量引入所述隐藏状态的对话集合中生成语料词汇表；
S33，所述语料词汇表与所述主题词组成的主题词表在联合生成单元中提供回复词，所述回复词经解码器解码生成回复。

6.根据权利要求3所述的自动回复对话方法，其特征在于，所述S22中将字符向量编码为隐藏状态的公式为：...

【专利技术属性】
技术研发人员：鲁小玲，
申请(专利权)人：孝感天创信息科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人