语音指令识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：23402002 阅读：33 留言：0更新日期：2020-02-22 14:04

本发明专利技术涉及语音指令识别方法、装置、电子设备及存储介质，其中，语音指令识别方法包括如下步骤：获取用户的语音数据；通过语音识别将所述语音数据识别为文本序列；基于所述文本序列和多路自注意力机制提取所述文本序列中每个字包含语义信息的表征向量序列；对所述表征向量序列进行处理，得到意图信息和词槽；确定与所述意图信息对应的指令；通过所述词槽判断所述指令是否完整，若完整，则对所述指令进行解码并输出指令内容。本发明专利技术实施例的语音指令识别方法，减少了语音指令识别在基于文本序列输出与文本序列对应的指令内容的训练过程及实际使用过程中的耗时，且减少了计算资源的浪费。

Speech instruction recognition method, device, electronic equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
语音指令识别方法、装置、电子设备及存储介质
本专利技术涉及计算机
，具体涉及一种语音指令识别方法、装置、用于语音指令识别的电子设备、计算机存储介质及语音交互处理方法。
技术介绍
智能服务机器人是一种以人工智能技术为基础的产品，通过对话的形式和使用者进行交互，该智能服务机器在和使用者的交互过程中可以向用户提供服务。现有的用于智能服务机器人的语音指令识别方法，通过多层RNN(递归神经网络)将语音文本序列中每个字包含语义信息的表征向量序列提取出，然后对于表征向量序列进行处理得到意图信息和词槽。然而，由于RNN在对一个文本序列进行计算时，文本序列中每一个元素的计算需要依赖其前一个元素的计算结果，也就是说，只有完成了文本序列中前一个元素的计算，才能进行下一个元素的计算，这就要求计算过程必须是顺序的，无法进行并行计算，使得针对文本序列计算得到表征向量序列的速度较慢，从而导致了现有的语音指令识别过程耗时多且占用较多的计算资源，此外，在通过训练神经网络模型以识别语音指令时，训练过程也会耗时较多且占用较多的计算资源。r>
技术实现思路
...

【技术保护点】
1.一种语音指令识别方法，其特征在于，包括如下步骤：/n获取用户的语音数据；/n通过语音识别将所述语音数据识别为文本序列；/n基于所述文本序列和多路自注意力机制提取所述文本序列中每个字包含语义信息的表征向量序列；/n对所述表征向量序列进行处理，得到意图信息和词槽；/n确定与所述意图信息对应的指令；/n通过所述词槽判断所述指令是否完整，若完整，则对所述指令进行解码并输出指令内容。/n

【技术特征摘要】
1.一种语音指令识别方法，其特征在于，包括如下步骤：
获取用户的语音数据；
通过语音识别将所述语音数据识别为文本序列；
基于所述文本序列和多路自注意力机制提取所述文本序列中每个字包含语义信息的表征向量序列；
对所述表征向量序列进行处理，得到意图信息和词槽；
确定与所述意图信息对应的指令；
通过所述词槽判断所述指令是否完整，若完整，则对所述指令进行解码并输出指令内容。

2.根据权利要求1所述的语音指令识别方法，其特征在于，所述基于所述文本序列和多路自注意力机制提取所述文本序列中每个字包含语义信息的表征向量序列包括：
对所述文本序列进行词嵌入处理以获得字向量序列；
基于所述文本序列中每个字的位置信息以获得位置向量序列；
将所述字向量序列与所述位置向量序列通过多路自注意力机制提取每个字包含语义信息的表征向量序列。

3.根据权利要求2所述的语音指令识别方法，其特征在于，将所述字向量序列与所述位置向量序列通过多层多路自注意力机制提取每个字包含语义信息的表征向量序列。

4.根据权利要求2所述的语音指令识别方法，其特征在于，将所述字向量序列与所述位置向量序列通过多路自注意力机制提取每个字包含语义信息的表征向量序列包括：
将所述字向量序列与所述位置向量序列经过3种不同的线性变换，得到多路K，V，Q的矢量组合；
针对每一组K，V，Q，分别计算注意力；
将多路得到的注意力结果进行合并，并依次经过归一化、前向网络、以及进一步归一化，得到所述每个字包含语义信息的表征向量序列。

5.根据权利要求2～4任一项所述的语音指令...

【专利技术属性】
技术研发人员：郑永升，石磊，曹越，
申请(专利权)人：杭州依图医疗技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人