声音识别方法、装置、介质和电子设备制造方法及图纸

技术编号:40415522 阅读:18 留言:0更新日期:2024-02-20 22:32
本申请涉及声音识别技术领域,特别是涉及一种声音识别方法、装置、介质和电子设备。该方法包括:获取预处理后的待识别声音;对上述待识别声音进行特征提取,得到待识别声音对应的待识别特征向量;将上述待识别特征向量输入目标卷积神经网络模型,得到对应的声音类别;根据上述声音类别遍历预设映射表,得到目标声音识别模型;将上述待识别声音输入至上述目标声音识别模型,输出待识别声音对应的文字。本申请对不同声音类别的待识别声音进行分类处理,每一声音类别均有对应的声音识别模型,由此,利用不同声音识别模型针对性处理不同口音的待识别声音,识别的结果的准确度更高。

【技术实现步骤摘要】

所属的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。根据本申请的这种实施方式的电子设备。电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。其中,上述储存器存储有程序代码,上述程序代码可以被上述处理器执行,使得上述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。储存器可以包括易失性储存器形式的可读介质,例如随机存取储存器(ram)和/或高速缓存储存器,还可以进一步包括只读储存器(rom)。储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括本文档来自技高网...

【技术保护点】

1.一种声音识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的声音识别方法,其特征在于,所述获取预处理后的待识别声音,包括:

3.根据权利要求1所述的声音识别方法,其特征在于,所述待识别特征向量包括:音高特征、音强特征、音质特征和频谱特征。

4.根据权利要求1所述的声音识别方法,其特征在于,所述目标卷积神经网络模型是根据以下步骤训练得到的:

5.根据权利要求4所述的声音识别方法,其特征在于,所述根据若干关键训练样本,得到若干向量空间,包括:

6.根据权利要求1所述的声音识别方法,其特征在于,所述预设映射表包括每一声音...

【技术特征摘要】

1.一种声音识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的声音识别方法,其特征在于,所述获取预处理后的待识别声音,包括:

3.根据权利要求1所述的声音识别方法,其特征在于,所述待识别特征向量包括:音高特征、音强特征、音质特征和频谱特征。

4.根据权利要求1所述的声音识别方法,其特征在于,所述目标卷积神经网络模型是根据以下步骤训练得到的:

5.根据权利要求4所述的声音识别方法,其特征在于,所述根据若干关键训练样本,得到若干向量空间,包括:

6.根据权利要求1所述的声音识别方法,其特征...

【专利技术属性】
技术研发人员:胡程远吴真飞魏祥成
申请(专利权)人:深圳波洛斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1