声音识别方法、装置、介质和电子设备制造方法及图纸

技术编号：40415522 阅读：18 留言：0更新日期：2024-02-20 22:32

本申请涉及声音识别技术领域，特别是涉及一种声音识别方法、装置、介质和电子设备。该方法包括：获取预处理后的待识别声音；对上述待识别声音进行特征提取，得到待识别声音对应的待识别特征向量；将上述待识别特征向量输入目标卷积神经网络模型，得到对应的声音类别；根据上述声音类别遍历预设映射表，得到目标声音识别模型；将上述待识别声音输入至上述目标声音识别模型，输出待识别声音对应的文字。本申请对不同声音类别的待识别声音进行分类处理，每一声音类别均有对应的声音识别模型，由此，利用不同声音识别模型针对性处理不同口音的待识别声音，识别的结果的准确度更高。

全部详细技术资料下载

【技术实现步骤摘要】

所属的技术人员能够理解，本申请的各个方面可以实现为系统、方法或程序产品。因此，本申请的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式（包括固件、微代码等），或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。根据本申请的这种实施方式的电子设备。电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于：上述至少一个处理器、上述至少一个储存器、连接不同系统组件（包括储存器和处理器）的总线。其中，上述储存器存储有程序代码，上述程序代码可以被上述处理器执行，使得上述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。储存器可以包括易失性储存器形式的可读介质，例如随机存取储存器（ram）和/或高速缓存储存器，还可以进一步包括只读储存器（rom）。储存器还可以包括具有一组（至少一个）程序模块的程序/实用工具，这样的程序模块包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个...

【技术保护点】

1.一种声音识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的声音识别方法，其特征在于，所述获取预处理后的待识别声音，包括：

3.根据权利要求1所述的声音识别方法，其特征在于，所述待识别特征向量包括：音高特征、音强特征、音质特征和频谱特征。

4.根据权利要求1所述的声音识别方法，其特征在于，所述目标卷积神经网络模型是根据以下步骤训练得到的：

5.根据权利要求4所述的声音识别方法，其特征在于，所述根据若干关键训练样本，得到若干向量空间，包括：

6.根据权利要求1所述的声音识别方法，其特征在于，所述预设映射表包括每一声音...

【技术特征摘要】

1.一种声音识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的声音识别方法，其特征在于，所述获取预处理后的待识别声音，包括：

3.根据权利要求1所述的声音识别方法，其特征在于，所述待识别特征向量包括：音高特征、音强特征、音质特征和频谱特征。

4.根据权利要求1所述的声音识别方法，其特征在于，所述目标卷积神经网络模型是根据以下步骤训练得到的：

5.根据权利要求4所述的声音识别方法，其特征在于，所述根据若干关键训练样本，得到若干向量空间，包括：

6.根据权利要求1所述的声音识别方法，其特征...

【专利技术属性】
技术研发人员：胡程远，吴真飞，魏祥成，
申请(专利权)人：深圳波洛斯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人