一种语句识别方法、语句识别装置及智能设备制造方法及图纸

技术编号：25346088 阅读：13 留言：0更新日期：2020-08-21 17:05

本申请公开了一种语句识别方法、语句识别装置及智能设备，该方法将当前用户语句拼接上历史语句后输入到预训练模型中，得到预训练模型发掘的拼接语句的信息，以实现在少语料的情况下发掘出较多的特征信息；进一步地，再通过RNN模型来拆分字符级编码及上下文信息的编码，提取所需的特征，并基于所提取的特征实现对当前用户语句的识别。上述识别过程还有效结合了上下文信息，提升了对当前用户语句的理解效率及理解准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种语句识别方法、语句识别装置及智能设备
本申请属于人工智能
，尤其涉及一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质。
技术介绍
随着技术的发展，人机对话交互系统得到了日益广泛的应用，为了实现自动化的人机对话，计算机需要从用户输入的文字中解析出蕴含的意图、对话行为类别，并抽取出其中的关键词，来制定相应的答复策略。近些年来，随着深度学习技术的发展及计算机运算能力的提升，人们开始将深度学习技术应用在人机对话系统当中。然而，当前处理基于多轮会话的多任务语义解析这一任务的代表模型仍存在准确率不高等问题，无法满足人们的需求。
技术实现思路
本申请实施例提供了一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质，可提升对当前用户语句的理解效率及理解准确度。本申请的第一方面提供了一种语句识别方法，包括：获取当前用户语句及历史语句集合，其中，上述当前用户语句为当前轮次的用户语句，上述历史语句集合由至少一个历史语句构成，上述历史语句包括各个历史轮次的用户语句及各个历史轮次的系统语句；将上述当前用户语句分别与上述历史语句集合中的各个历史语句进行拼接，得到至少一个拼接语句；分别为至少一个拼接语句标记位置；将至少一个已标记位置的拼接语句输入至预训练模型中，分别对应得到至少一个预训练结果；将上述至少一个预训练结果输入至已训练的第一类循环神经网络(RecurrentNeuralNetwork，RNN)模型中，分别对应得到上述第一类循环神经网络模型输...

【技术保护点】
1.一种语句识别方法，其特征在于，包括：/n获取当前用户语句及历史语句集合，其中，所述当前用户语句为当前轮次的用户语句，所述历史语句集合由至少一个历史语句构成，所述历史语句包括各个历史轮次的用户语句及各个历史轮次的系统语句；/n将所述当前用户语句分别与所述历史语句集合中的各个历史语句进行拼接，得到至少一个拼接语句；/n分别为至少一个拼接语句标记位置；/n将至少一个已标记位置的拼接语句输入至预训练模型中，分别对应得到至少一个预训练结果；/n将所述至少一个预训练结果输入至已训练的第一类循环神经网络模型中，分别对应得到所述第一类循环神经网络模型输出的与各个预训练结果相关的前向输出结果和后向输出结果；/n根据与各个预训练结果相关的前向输出结果和后向输出结果对所述当前用户语句进行识别。/n

【技术特征摘要】
1.一种语句识别方法，其特征在于，包括：
获取当前用户语句及历史语句集合，其中，所述当前用户语句为当前轮次的用户语句，所述历史语句集合由至少一个历史语句构成，所述历史语句包括各个历史轮次的用户语句及各个历史轮次的系统语句；
将所述当前用户语句分别与所述历史语句集合中的各个历史语句进行拼接，得到至少一个拼接语句；
分别为至少一个拼接语句标记位置；
将至少一个已标记位置的拼接语句输入至预训练模型中，分别对应得到至少一个预训练结果；
将所述至少一个预训练结果输入至已训练的第一类循环神经网络模型中，分别对应得到所述第一类循环神经网络模型输出的与各个预训练结果相关的前向输出结果和后向输出结果；
根据与各个预训练结果相关的前向输出结果和后向输出结果对所述当前用户语句进行识别。

2.如权利要求1所述的语句识别方法，其特征在于，所述根据与各个预训练结果相关的前向输出结果和后向输出结果对所述当前用户语句进行识别，包括：
将与同一预训练结果相关的最后一个前向输出结果与最后一个后向输出结果进行拼接，以得到与各个预训练结果相关的拼接结果；
将与各个预训练结果相关的拼接结果输入至已训练的第二类循环神经网络模型中，通过所述第二类循环神经网络模型进行处理，得到所述当前用户语句的意图及对话行为。

3.如权利要求2所述的语句识别方法，其特征在于，所述第二类循环神经网络模型包括第一GRU模型，所述将与各个预训练结果相关的拼接结果输入至已训练的第二类循环神经网络模型中，通过第二类循环神经网络模型训练处理，得到所述当前用户语句的意图及对话行为，包括：
将所有拼接结果输入至所述第一GRU模型中，得到所述第一GRU模型中最后一层隐藏层的输出；
将所述第一GRU模型中最后一层隐藏层的输出作为所述第一GRU模型中与意图及对话行为相关的分类层的输入，得到与意图及对话行为相关的分类层所输出的所述当前用户语句属于每一意图类别的概率及所述当前用户语句属于每一对话行为类别的概率；
根据所述当前用户语句属于每一意图类别的概率，确定所述当前用户语句的意图，并根据所述当前用户语句属于每一对话行为类别的概率，确定所述当前用户语句的对话行为。

4.如权利要求1所述的语句识别方法，其特征在于，所述根据与各个预训练结果相关的前向输出结果和后向输出结果对所述当前用户语句进行识别，包括：
基于预设的筛选条件，对与各个预训练结果相关的前向输出结果和后向输出结果进行筛选，得到至少一个筛选结果，其中，一个筛选结果包括与一个预训练结果相关的前向输出结果和后向输出结果；
将所述至少一个筛选结果输入至已训练的第二类循环神经网络模型中，通过所述第二类循环神经网络模型进行处理，得到所述当前用户语句的词槽。

5.如权利要求1至4任一项所述的语句识别方法，其特征在于，所述将所述当前用户语句分别与所述历史语句集合中的各个历史语句进行拼接，得到至少一个拼接语句，包括：
获取组成所述当前用户语句的各个词语；
获取组成待拼接历史语句的各个词语，其中，所述待拼接历史语句为所述历史语句集合中的任一历史语句；
基于所述待拼接历史语句-当前用户语句的顺序，通过预设的间隔符将组成所述当前用户语句的各个词语拼接于组成所述待拼接历史语句的各个词语之后，得到所述当前用...

【专利技术属性】
技术研发人员：熊为星，马力，熊友军，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人