一种支持不同语种的命令词检测方法及设备技术

技术编号：22848341 阅读：26 留言：0更新日期：2019-12-17 23:09

本发明专利技术公开了一种支持不同语种的命令词检测方法及设备，首先采集至少包括两种不同语种的语音信号；接着提取所述语音信号的音频特征；进一步地通过深度学习网络对所提取的音频特征进行分类预测，得到分类预测结果；若所述分类预测结果为命令词的概率最大，则将所述概率最大的命令词作为输出结果。

A command word detection method and equipment supporting different languages

全部详细技术资料下载

【技术实现步骤摘要】
一种支持不同语种的命令词检测方法及设备
本专利技术涉及语言识别技术，尤其涉及一种支持不同语种的命令词检测方法及设备。
技术介绍
随着科学技术的不断发展，语音交互技术已经被广泛的应用到嵌入式设备中，如手机，手表，音箱和耳机等。为了降低设备的运行功耗，一般先采用特定的命令词对设备进行唤醒，如苹果手机的“HeySiri”，小米AI音箱的“小爱同学”等。相关技术中，命令词检测系统通常是将输入的语音信号在经过特征提取后，作为深度学习网络的输入；深度学习网络的输出是命令词中每个词的概率，在经过后处理模块后，可以得到输入语音信号为命令词的概率。当该概率大于给定的阈值时，则系统判定输入的语音信号包含命令词；反之，则判定没有检测到命令词。很显然，当前的命令词检测方法仅支持单一语种，且只支持单一命令词的检测。
技术实现思路
本专利技术实施例为了解决当前命令词检测系统所存在的以上缺陷，创造性地提供一种支持不同语种的命令词检测方法及设备。根据本专利技术的第一方面，提供一种支持不同语种的命令词检测方法，所述方法包括：采集至少包括两种不同语种的语音信号；提取所述语音信号的音频特征；通过深度学习网络对所提取的音频特征进行分类预测，得到分类预测结果；若所述分类预测结果为命令词的概率最大，则将所述概率最大的命令词作为输出结果。根据本专利技术一实施方式，所述通过深度学习网络对所提取的音频特征进行分类预测，得到分类预测结果，包括：通过支持多语种的深度学习网络对所提取的音频特征进行分类，得到包括命令词和非...

【技术保护点】
1.一种支持不同语种的命令词检测方法，其特征在于，所述方法包括：/n采集至少包括两种不同语种的语音信号；/n提取所述语音信号的音频特征；/n通过深度学习网络对所提取的音频特征进行分类预测，得到分类预测结果；/n若所述分类预测结果为命令词的概率最大，则将所述概率最大的命令词作为输出结果。/n

【技术特征摘要】
1.一种支持不同语种的命令词检测方法，其特征在于，所述方法包括：
采集至少包括两种不同语种的语音信号；
提取所述语音信号的音频特征；
通过深度学习网络对所提取的音频特征进行分类预测，得到分类预测结果；
若所述分类预测结果为命令词的概率最大，则将所述概率最大的命令词作为输出结果。

2.根据权利要求1所述的方法，其特征在于，所述通过深度学习网络对所提取的音频特征进行分类预测，得到分类预测结果，包括：
通过支持多语种的深度学习网络对所提取的音频特征进行分类，得到包括命令词和非命令词的概率；
判断所得到的命令词和非命令词的概率中概率最大的词的类别，得到分类预测结果。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：
若所述分类预测结果为非命令词的概率最大，则判定所述语音信号中不包含命令词。

4.根据权利要求1所述的方法，其特征在于，提取所述语音信号的音频特征，包括：
提取所述语音信号的Fbank特征；或，提取所述语音信号的MFCC特征。

5.根据权利要求1所述的方法，其特征在于，通过深度学习网络对所提取的音频特征进行分类预测，包括：
借助递归神经网络RNN、卷积神经网络CNN或时延神经网络TDNN对所提取的音频特征进行分类预测。

6.根据权利要求5所述的方法，...

【专利技术属性】
技术研发人员：匡方军，李深，雷欣，李志飞，
申请(专利权)人：出门问问信息科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人