一种语句识别方法、语句识别装置及智能设备制造方法及图纸

技术编号：23891785 阅读：59 留言：0更新日期：2020-04-22 06:46

本申请公开了一种语句识别方法、装置、智能设备及计算机可读存储介质，其中，该方法包括：对接收的输入语句进行实体词语识别；若输入语句不存在实体词语，则将输入语句作为识别语料；否则基于各个实体词语及其所属的实体词语类别对输入语句进行替换，得到多个替换语料作为识别语料；获取预设的多项意图类别，并得到各项意图类别所包含的模板语料；通过已训练的神经网络模型得到各个识别语料的语句向量以及各个模板语料的模板语料向量；计算得到各项意图类别的平均语料向量；根据各语句向量与每一平均语料向量的相似度，确定各识别语料的所属意图类别；根据每一识别语料的所属意图类别，确定输入语句的意图。本申请方案可提升语音助手的工作效率。

A statement recognition method, statement recognition device and intelligent device

全部详细技术资料下载

【技术实现步骤摘要】
一种语句识别方法、语句识别装置及智能设备
本申请属于人工智能
，尤其涉及一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质。
技术介绍
当前，随着当前人工智能的不断发展，用户已经可以通过智能设备所搭载的语音助手实现多项操作。语音助手在识别用户所输入的语句时，往往会先对该语句的意图进行识别，以获知用户所需要进行的操作。这一过程往往会导致数据爆炸，从而影响到语音助手的工作效率。
技术实现思路
有鉴于此，本申请提供了提供了一种语句识别方法、语句识别装置、智能设备及计算机可读存储介质，可提升语音助手识别语句的速度，减轻语音助手训练过程中的数据量。本申请的第一方面提供了一种语句识别方法，包括：接收输入语句；对上述输入语句进行实体词语识别；若上述输入语句不存在实体词语，则将上述输入语句作为识别语料；若上述输入语句存在一个以上实体词语，则基于上述输入语句所包含的一个以上实体词语，以及上述一个以上实体词语所属的实体词语类别，对上述输入语句进行替换，得到一个以上替换语料，并将上述替换语料作为识别语料；获取预设的一项以上意图类别，并得到每一项意图类别所包含的模板语料，其中，每一项意图类别对应一个意图；通过已训练的神经网络模型，得到各个识别语料的语句向量以及各个模板语料的模板语料向量；根据各项意图类别所包含的模板语料的模板语料向量，计算得到各项意图类别的平均语料向量；分别计算每一语句向量与每一项意图类别的平均语料向量的相似度，以确定...

【技术保护点】
1.一种语句识别方法，其特征在于，包括：/n接收输入语句；/n对所述输入语句进行实体词语识别；/n若所述输入语句不存在实体词语，则将所述输入语句作为识别语料；/n若所述输入语句存在一个以上实体词语，则基于所述输入语句所包含的一个以上实体词语，以及所述一个以上实体词语所属的实体词语类别，对所述输入语句进行替换，得到一个以上替换语料，并将所述替换语料作为识别语料；/n获取预设的一项以上意图类别，并得到每一项意图类别所包含的模板语料，其中，每一项意图类别对应一个意图；/n通过已训练的神经网络模型，得到各个识别语料的语句向量以及各个模板语料的模板语料向量；/n根据各项意图类别所包含的模板语料的模板语料向量，计算得到各项意图类别的平均语料向量；/n分别计算每一语句向量与每一项意图类别的平均语料向量的相似度，以确定每一识别语料的所属意图类别；/n根据每一识别语料的所属意图类别，确定所述输入语句的意图。/n

【技术特征摘要】
1.一种语句识别方法，其特征在于，包括：
接收输入语句；
对所述输入语句进行实体词语识别；
若所述输入语句不存在实体词语，则将所述输入语句作为识别语料；
若所述输入语句存在一个以上实体词语，则基于所述输入语句所包含的一个以上实体词语，以及所述一个以上实体词语所属的实体词语类别，对所述输入语句进行替换，得到一个以上替换语料，并将所述替换语料作为识别语料；
获取预设的一项以上意图类别，并得到每一项意图类别所包含的模板语料，其中，每一项意图类别对应一个意图；
通过已训练的神经网络模型，得到各个识别语料的语句向量以及各个模板语料的模板语料向量；
根据各项意图类别所包含的模板语料的模板语料向量，计算得到各项意图类别的平均语料向量；
分别计算每一语句向量与每一项意图类别的平均语料向量的相似度，以确定每一识别语料的所属意图类别；
根据每一识别语料的所属意图类别，确定所述输入语句的意图。

2.如权利要求1所述的语句识别方法，其特征在于，所述对所述输入语句进行实体词语识别，得到所述输入语句所包含的一个以上实体词语，包括：
获取预设的一个以上实体词语类别；
依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别；
基于所述目标实体词语类别所关联的实体词语识别算法，对所述输入语句进行实体词语识别，得到属于所述目标实体词语类别的实体词语。

3.如权利要求2所述的语句识别方法，其特征在于，所述依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别，包括：
分别获取各个实体词语类别的优先级；
基于所述优先级由高至低的顺序，依次将所述一个以上实体词语类别中的一实体词语类别确定为目标实体词语类别。

4.如权利要求1所述的语句识别方法，其特征在于，所述分别计算每一语句向量与每一项意图类别的平均语料向量的相似度，以确定每一识别语料的所属意图类别，包括：
计算待匹配识别语料的语句向量与待匹配意图类别的平均语料向量的距离，其中，所述待匹配识别语料为任一识别语料，所述待匹配意图类别为任一意图类别；
将与所述待匹配识别语料的语句向量的距离最大的平均语料向量所对应的意图类别确定为所述待匹配识别语料的所属意图类别。

5.如权利要求1至4任一项所述的语句识别方法，其特征在于，所述语句识别方法还包括对所述神经网络模型的训练，所述训练的过程包括：
初始化待训练的神经网络模型的模型参数；
获取每一项待训练意图类别所包含的待训练模板语料；
将一个以上待训练模板语料输入至所述神经网络模型，得到一个以上待训练模板语料向量；
根据每一项待训练意图类别所包含的待训练模板语料，计算得到每一项待训练意图类别的待训练平均语料向...

【专利技术属性】
技术研发人员：黄日星，熊友军，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人