一种适用于噪声条件下的智能终端设备控制方法及系统技术方案

技术编号：38125857 阅读：9 留言：0更新日期：2023-07-08 09:29

本发明专利技术涉及语音控制系统技术领域，具体公开了一种适用于噪声条件下的智能终端设备控制方法及系统，包括监听用户说出的音频信号，并判断音频信号中是否包含唤醒词，当检测到用户说出唤醒词时，唤醒智能终端设备进入全功率运行状态；采集用户音频信号并进行增强处理，以获得用户语音信号；利用基于卷积神经网络和注意力机制构建的关键字识别器识别用户语音信号中的关键字，并基于关键字生成语音指令序列；对语音指令序列进行解析，以转化为系统控制命令；以及基于系统控制命令对智能终端设备进行控制；该方法以较低的资源消耗实现了准确、高效的智能终端设备控制。高效的智能终端设备控制。高效的智能终端设备控制。

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于噪声条件下的智能终端设备控制方法及系统

[0001]本专利技术涉及语音控制系统
，具体涉及一种适用于噪声条件下的智能终端设备控制方法及系统。

技术介绍

[0002]随着智能终端设备的普及以及深度学习技术的发展，人们对智能终端设备体积小、响应速度快、智能化程度高等的要求逐渐提高；深度学习技术为了达到较好的实际应用效果，往往采用较大的模型结构，这不仅对智能终端设备的内存有较高的要求，同样对计算资源也是一种挑战；智能终端设备低资源、低消耗的要求与深度学习技术高内存、高消耗的矛盾，极大的限制了深度学习技术在智能终端设备上的应用。
[0003]关键词识别技术作为智能终端设备人机交互的开端，具有重要的应用价值；智能终端设备接收用户的语音后，检测语音中包含的关键字，依据关键字进行相对应的预设操作，以此实现用户对智能终端设备的控制；在现有的关键字识别方法中，受应用场景(终端设备为主)低内存，低资源消耗的限制，大部分方法都趋向于降低模型参数，因此识别的准确率受到了一定的影响，因此如何使用更少的参数量和更低的资源消耗来实现更高的准确率的关键字识别模型成为了亟待解决的问题。

技术实现思路

[0004]针对上述问题，本专利技术的一个目的是提供一种适用于噪声条件下的智能终端设备控制方法，该方法采用卷积神经网络与注意力机制相结合，以极低的模型参数量，实现了真实终端设备的关键字识别；该方法以频率压缩为条件的带权注意力，将全局特征更好的馈送给局部特征，从而达到更加快速、准确、优秀的识别关键字的效果；该方法将深...

【技术保护点】

【技术特征摘要】
1.一种适用于噪声条件下的智能终端设备控制方法，其特征在于，，包括以下步骤：S100：监听用户说出的音频信号，并判断所述音频信号中是否包含唤醒词，当检测到用户说出唤醒词时，唤醒智能终端设备进入全功率运行状态；S200：采集用户音频信号并进行增强处理，以获得用户语音信号；S300：利用基于卷积神经网络和注意力机制构建的关键字识别器识别所述用户语音信号中的预测关键字，并基于所述预测关键字生成语音指令序列；其中，所述关键字识别器包括原始特征提取器、隐藏特征处理器和分类特征判别器，所述原始特征提取器用于从所述用户语音信号中提取高维语音特征，所述隐藏特征处理器用于从所述高维语音特征中提取第一隐藏特征和第二隐藏特征，所述分类特征判别器用于根据所述第二隐藏特征获取预测关键字；S400：对所述语音指令序列进行解析，以转化为系统控制命令；以及基于所述系统控制命令对智能终端设备进行控制。2.根据权利要求1所述的智能终端设备控制方法，其特征在于，所述步骤S300包括以下子步骤：S310：对所述用户语音信号进行预处理以获得低维音频特征；所述低维音频特征为MFCC梅尔频率倒谱系数；S320：将所述低维音频特征输入所述原始特征提取器以获得高维语音特征；S330：将所述高维语音特征输入隐藏特征处理器以获得第一隐藏特征和第二隐藏特征；S340：将所述第二隐藏特征输入分类特征判别器中，以获得预测关键字，并基于所述预测关键字生成语音指令序列。3.根据权利要求1所述的智能终端设备控制方法，其特征在于，所述隐藏特征处理器包括全局特征提取器和局部特征提取器，所述全局特征提取器基于注意力机制构建，用于从所述高维语音特征中提取第一隐藏特征；所述局部特征提取器基于卷积神经网络构建，用于根据所述高维语音特征和第一隐藏特征获得第二隐藏特征。4.根据权利要求3所述的智能终端设备控制方法，其特征在于，所述全局特征提取器通过对所述高维语音特征进行三次卷积操作分别得到归一化后的高维语音特征Q、K、V，使用Q对K进行查询，并加入位置编码PE得到注意力的值，再对注意力的值进行softmax归一化，与V进行加权后，通过GELU函数激活，使用二维卷积操作调整特征维度，再经过BN层归一化后，得到第一隐藏特征。5.根据权利要求3所述的智能终端设备控制方法，其特征在于，所述局部特征提取器包括频率特征提取模块、时间特征提取模块和加权迭代模块，所述频率特征提取模块用于对所述第一隐藏特征进行频率卷积...

【专利技术属性】
技术研发人员：柯登峰，杜宝乐，王运峰，徐艳艳，
申请(专利权)人：澳克多普有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人