垃圾指令识别方法及装置制造方法及图纸

技术编号：28452358 阅读：20 留言：0更新日期：2021-05-15 21:15

公开了一种垃圾指令识别方法及装置。该方法应包括获取音频信息；将所述音频信息转换为文字信息；提取所述音频信息的音频特征生成音频特征集合；利用预训练的文本模型获取所述文本信息的特征向量；将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令。为垃圾指令。为垃圾指令。

全部详细技术资料下载

【技术实现步骤摘要】
垃圾指令识别方法及装置

[0001]本申请涉及自然语言处理
，尤其涉及一种垃圾指令识别方法及装置。

技术介绍

[0002]目前，大部分智能设备都具备语音识别功能，且智能设备的语音识别状态有两种，一种是免唤醒状态，一种是唤醒状态。免唤醒状态与唤醒状态最大的不同在于，唤醒状态是用户先说唤醒词将智能设备唤醒，在智能设备被唤醒之后紧接着说出指令。智能设备在被唤醒之后接收到的用户语音即可以认为是有效的指令，从而直接进行指令内容的功能性识别(如查天气、播音乐等)。而智能设备在免唤醒的状态下，一次唤醒即可实现连续对话的状态，不需要每次对话的时候都说一次唤醒词，从而能够获得更好的用户体验。
[0003]但是在免唤醒状态下，需要智能设备能够识别接收到的音频是不是给它的指令，过滤掉无效干扰信息，再做出反应。因此，如何高质量的识别出接收到的音频是否为垃圾指令的问题亟待解决。

技术实现思路

[0004]为解决上述问题，本专利技术提供一种垃圾指令识别方法及装置，能够高质量的识别出接收到的音频是否为垃圾指令，从而提高智能设备在免唤醒状态下对音频识别的正确率，提升用户体验。
[0005]为了实现上述目的，在第一方面，本专利技术实施例提供了一种垃圾指令识别方法，该方法包括：
[0006]获取音频信息；
[0007]将所述音频信息转换为文字信息；
[0008]提取所述音频信息的音频特征生成音频特征集合；
[0009]利用预训练的文本模型获取所述文本信息的特征向量；
[001...

【技术保护点】

【技术特征摘要】
1.一种垃圾指令识别方法，其特征在于，所述方法包括：获取音频信息；将所述音频信息转换为文字信息；提取所述音频信息的音频特征生成音频特征集合；利用预训练的文本模型获取所述文本信息的特征向量；将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令。2.根据权利要求1所述的方法，其特征在于，在所述获取音频信息之后，所述方法还包括：如果所述音频信息无法转换为文字信息，则确定所述音频信息为垃圾指令，并丢弃所述音频信息。3.根据权利要求1所述的方法，其特征在于，在所述将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令之后，所述方法还包括：如果所述音频信息不是垃圾指令，则对所述文本信息进行自然语言理解，并执行所述音频信息对应的动作；如果所述音频信息是垃圾指令，则丢弃所述音频信息。4.根据权利要求1所述的方法，其特征在于，所述将所述音频特征集合和所述特征向量作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令，包括：将所述音频特征集合和所述特征向量合成为一维特征，并将所述一维特征作为深度神经网络分类器输入，根据所述深度神经网络的输出确定所述音频信息是否为垃圾指令。5.根据权利要求1所述的方法，其特征在于，所述音频特征包括：语音音频特征、语音文本特征及语音时长。6.一种垃圾指令识别装置，其特征在于，所述装置包括：第一获取单元，用于获取音频信息；转换单元，用于将所述音频信息转换为文字信息；生...

【专利技术属性】
技术研发人员：胡晓慧，孟振南，雷欣，李志飞，
申请(专利权)人：出门问问武汉信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人