语音数据处理方法及装置、语音控制系统制造方法及图纸

技术编号：43558522 阅读：25 留言：0更新日期：2024-12-06 17:32

本公开提供了一种语音数据处理方法及装置、语音控制系统，涉及计算机技术领域，可用于人工智能、语音识别、深度学习等技术领域，该方法包括：获取待处理语音数据；将待处理语音数据发送到可编程逻辑单元对待处理语音数据进行语音特征提取，获取待处理语音数据对应的语音特征向量；并在可编程逻辑单元中将语音特征向量转换为多通道的输入特征图；将输入特征图发送到存内计算芯片，利用存内计算芯片上预先配置的语音关键词检测模型对输入特征图进行语音关键词检测，获得语音关键词检测结果；将语音关键词检测结果反馈至主控系统，主控系统用于根据语音关键词检测结果，执行与语音关键词检测结果对应的响应操作。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机，特别涉及一种语音数据处理方法及装置、语音关键词检测模型的训练方法、语音控制系统、电子设备、计算机可读存储介质。

技术介绍

1、随着人工智能(ai)算法以及ai芯片等硬件技术的发展，智能设备已经在日常生活中被广泛应用。如智能家居语音控制系统、智能音箱、智能会议系统等。语音交互在智能设备中的应用极为广泛且日益成熟。在传统的语音交互场景中，最初为通过点击按钮，例如按下录音键的方式来唤醒设备，才能和设备进行交互。

2、为了进一步提升人机交互体验，语音关键词检测技术应运而生，语音唤醒或关键词检测(speech keyword spotting)是语音识别(speech recognition)的子领域。语音识别是指从一段连续的语音信号中提取出有用信息，转化成计算机可以识别的字符串，通常为二进制字符流、文本内容。语音关键词检测不需要整段识别语音信号，只需要判断出信号中是否包含某个或某些关键词。

3、目前，语音关键词检测主要有三种方式：基于模板匹配的唤醒技术；基于隐马尔可夫模型的唤醒技术；基于深度学习的唤醒技...

【技术保护点】

1.一种语音数据处理方法，其中，所述语音数据处理方法包括：

2.根据权利要求1所述的语音数据处理方法，其中，所述对所述待处理语音数据进行语音特征提取，以获取所述待处理语音数据对应的语音特征向量，包括：

3.根据权利要求1所述的语音数据处理方法，其中，所述语音特征向量是一个二维的语音特征向量，所述将所述语音特征向量转换为多通道的输入特征图，包括：

4.根据权利要求1所述的语音数据处理方法，其中，所述语音关键词检测模型是基于卷积混合网络ConvMixer架构构建的模型，所述语音关键词检测模型包括特征采样层、卷积混合网络和分类输出层；p>

5.根据权...

【技术特征摘要】

1.一种语音数据处理方法，其中，所述语音数据处理方法包括：

4.根据权利要求1所述的语音数据处理方法，其中，所述语音关键词检测模型是基于卷积混合网络convmixer架构构建的模型，所述语音关键词检测模型包括特征采样层、卷积混合网络和分类输出层；

5.根据权利要求4所述的语音数据处理方法，其中，所述特征采样层，包括：特征块嵌入层、第一批量标准化层和第一激活函数层；

6.根据权利要求4所述的语音数据处理方法，其中，所述卷积混合网络，包括至少一个卷积混合网络模块，所述卷积混合网络模块包括包括空间位置卷积混合单元和通道位置卷积混合单元，所述空间位置卷积混合单元输出的空间位置混合...

【专利技术属性】
技术研发人员：王炳乾，段然，夏友祥，
申请(专利权)人：京东方科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人