人机对话控制方法、装置、服务器及可读存储介质制造方法及图纸

技术编号：25479638 阅读：56 留言：0更新日期：2020-09-01 23:00

本申请实施例提供了一种人机对话控制方法、装置、服务器及可读存储介质，首先，判断接收到的目标问题是否为寒暄问题；接着，在为寒暄问题时，通过预设的问答匹配规则生成第一问题答复，通过预设的文本生成规则生成第二问题答复；最后，根据第一问题答复和第二问题答复被用于回复目标问题的概率，确定采用第一问题答复还是第二问题答复作为目标问题的回复。采用两种不同的问题答复方式生成对目标问题的不同答复，并根据不同答复对应回复目标问题的概率选择较优的答复作为该目标问题的回复，不仅回复寒暄问题的答复具有灵活性，同时也能从不同的答复中选择较优的答复。

全部详细技术资料下载

【技术实现步骤摘要】
人机对话控制方法、装置、服务器及可读存储介质
本申请涉及人机交互
，具体而言，涉及一种人机对话控制方法、装置、服务器及可读存储介质。
技术介绍
随着计算机技术及网络技术的发展，人机交互机器人越来越多的被用来为用户提供智能服务，比如，客户服务或资讯查询服务。通常的人机交互机器人需要同时具备处理业务问题和寒暄问题，针对这两种问题，一般会对应有两种不同的知识库系统，在问题处理模型和方法上也存在较大的差别。对于寒暄问题，需要明确输入问题是否属于寒暄问题，在判断为是寒暄问题后，再进行相应的处理。目前的人机交互机器人在处理寒暄问题时，可以基于问答匹配和文本生成两种方法生成对寒暄问题的回复。问答匹配是将输入的寒暄问题与人机交互机器人的知识库中已存储的所有类别的寒暄问题进行文本相似度的匹配，从而确定对输入寒暄问题的回复。文本生成则是采用深度学习的方式将输入的寒暄问题作为深度学习系统的输入，经过深度学习后输出特定的寒暄回复。然而，上述两种方式生成的方法各有优缺点，基于问答匹配的方法具有回复可控，但灵活性缺乏的特点；基于文本生成的方法具有回复多样性，但回复缺乏评价标准的特点。如何使人机交互机器人在处理寒暄问题上即具有灵活性又具有可用的评价标准，成为本领域技术人员需要解决的技术问题。
技术实现思路
有鉴于此，本申请实施例的目的在于提供一种人机对话控制方法、装置、服务器及可读存储介质，可以对寒暄问题采用两种不同方式给出问题回复，选择较优的问题回复作为对该寒暄问题的答复。根据本申请实施例的一个...

【技术保护点】
1.一种人机对话控制方法，其特征在于，应用于交互机器人，所述方法包括：/n在接收到用户的目标问题时，判断接收到的目标问题是否为寒暄问题；/n在所述目标问题为寒暄问题时，根据预设的问答匹配规则从所述交互机器人的知识库中获得与所述目标问题对应的第一问题答复，及采用所述第一问题答复作为所述目标问题的回复的第一概率；/n在所述目标问题为寒暄问题时，根据预设的文本生成规则生成与所述目标问题对应的第二问题答复，并根据预设问题答复的评价规则计算采用所述第二问题答复作为所述目标问题的回复的第二概率；/n将所述第一概率和第二概率进行比较，根据比较结果选择第一问题答复或第二问题答复作为对所述目标问题的回复。/n

【技术特征摘要】
1.一种人机对话控制方法，其特征在于，应用于交互机器人，所述方法包括：
在接收到用户的目标问题时，判断接收到的目标问题是否为寒暄问题；
在所述目标问题为寒暄问题时，根据预设的问答匹配规则从所述交互机器人的知识库中获得与所述目标问题对应的第一问题答复，及采用所述第一问题答复作为所述目标问题的回复的第一概率；
在所述目标问题为寒暄问题时，根据预设的文本生成规则生成与所述目标问题对应的第二问题答复，并根据预设问题答复的评价规则计算采用所述第二问题答复作为所述目标问题的回复的第二概率；
将所述第一概率和第二概率进行比较，根据比较结果选择第一问题答复或第二问题答复作为对所述目标问题的回复。

2.如权利要求1所述的方法，其特征在于，所述将所述第一概率和第二概率进行比较，根据比较结果选择第一问题答复或第二问题答复作为对所述目标问题的回复，包括：
在所述第一概率大于第二概率时，将所述第一问题答复作为对所述目标问题的回复；
在所述第一概率小于第二概率时，将所述第二问题答复作为对所述目标问题的回复；
在所述第一概率等于第二概率时，在所述第一问题答复和所述第二问题答复中任选一个作为对所述目标问题的回复。

3.如权利要求1所述的方法，其特征在于，在所述交互机器人包括人机对话回复模型，判断接收到的目标问题是否为寒暄问题之前，所述方法还包括：
训练所述人机对话回复模型，其中，所述人机对话回复模型包括长短期记忆网络LSTM结构、寒暄问题判断子模型、多分类子模型、文本生成子模型及文本评价子模型；
所述训练所述人机对话回复模型，包括：
随机将各子模型的训练数据输入到所述LSTM结构中进行训练，并将经过所述LSTM结构训练后的训练结果输入到对应的各子模型中进行训练，直到所述人机对话回复模型收敛。

4.如权利要求3所述的方法，其特征在于，所述训练所述人机对话回复模型的步骤，还包括：
采用交叉熵损失函数计算每次训练后所述人机对话回复模型的损失函数值；
将所述损失函数值与预设阈值进行比较；
若所述损失函数值不小于所述预设阈值，则判定所述人机对话回复模型未收敛；
若所述损失函数值大于所述预设阈值，则判定所述人机对话回复模型收敛。

5.如权利要求3所述的方法，其特征在于，在随机将所述将各子模型的训练数据输入所述LSTM结构中进行训练之前，所述训练所述人机对话回复模型的步骤，还包括：
根据所述寒暄问题判断子模型、多分类子模型、文本生成子模型及文本评价子模型的训练数据的数据量大小，调整用于训练所述寒暄问题判断子模型、多分类子模型、文本生成子模型及文本评价子模型的训练数据的数据量。

6.如权利要求3所述的方法，其特征在于，所述训练所述人机对话回复模型的步骤，还包括：
在每次训练过程中，采用优化器对每次随机输入所述人机对话回复模型的训练数据所对应的子模型的参数和所述LSTM结构的参数进行优化，其中，所述优化器包括Adam优化器。

7.如权利要求3-6中任意一项所述的方法，其特征在于：所述交互机器人采用训练好的人机对话回复模型进行人机对话控制，其中，
采用所述寒暄问题判断子模型判断接收到的目标问题是否为寒暄问题；
在所述目标问题为寒暄问题时，采用所述多分类子模型获得与所述目标问题对应的第一问题答复，及所述第一问题答复作为所述目标问题的回复的第一概率，其中，所述多分类子模型用于训练问答匹配规则；
在所述目标问题为寒暄问题时，采用所述文本生成子模型生成与所述目标问题对应的第二问题答复，并采用所述文本评价子模型计算所述第二问题答复作为所述目标问题的回复的第二概率，其中，所述文本生成子模型用于训练文本生成规则，所述文本评价子模型用于训练问题答复的评价规则。

8.如权利要求3-6中任意一项所述的方法，其特征在于，在训练所述人机对话回复模型之前，所述方法还包括对所述人机对话回复模型的训练数据进行处理的步骤，所述步骤包括：
获取所述人机对话回复模型的训练数据；
将所述训练数据进行清洗处理；
将清洗处理后的训练数据进行编码得到词汇表，其中，所述词汇表包括数据所需的字和符号。

9.如权利要求8所述的方法，其特征在于，所述获取所述人机对话回复模型的训练数据的步骤，包括：
获取已标注的寒暄问题，将获取的寒暄问题作为所述多分类子模型的训练数据，其中，每类寒暄问题包括多个相似问题，每个问题包括对应的类别；
将所述多分类子模型的训练数据作为正例，将从业务问题中选择的预设数量的相似问题作为负例，由所述正例和所述负例组成所述寒暄问题判断子模型的训练数据，其中，每个正例和负例对应有标识是否为寒暄问题的标签；
将寒暄数据作为所述文本生成子模型的训练数据，其中，寒暄数据包括问题和答案对；
从所述寒暄数据和业务数据中随机抽样得到正例句子，由随机抽取的字组成的句子作为负例句子，由所述正例句子和负例句子作为所述文本评价子模型的训练数据，其中，相同字数的正例句子和负例句子的数量相同。

10.如权利要求9所述的方法，其特征在于，所述将所述训练数据进行清洗处理的步骤，包括：
将训练数据进行过滤，去除所述训练数据中非预设格式的数据；
将过滤后的训练数据进行数据整理，将各个子模型的训练数据整理为各个子模型所需的对应格式；
将所述各个子模型的训练数据按照预设比例划分为训练数据集和测试数据集。

11.如权利要求10所述的方法，其特征在于，所述将训练数据进行过滤，去除所述训练数据中非预设格式的数据的步骤，包括：
通过采用正则表达式匹配的方式将所述训练数据中包含的非预设格式的数据进行过滤，并将所述训练数据的字体转换为预设字体。

12.如权利要求8所述的方法，其特征在于，所述将清洗处理后的训练数据进行编码得到词汇表的步骤，包括：
对清洗处理后训练数据中的字或符号进行统计；
根据统计的字或符号的词频，对所述词汇表中的字或符号进行排序，得到所述词汇表。

13.一种人机对话控制装置，其特征在于，应用于交互机器人，所述装置包括：
判断模块，...

【专利技术属性】
技术研发人员：黄林豪，
申请(专利权)人：北京嘀嘀无限科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人