System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音处理方法及相关装置制造方法及图纸_技高网

语音处理方法及相关装置制造方法及图纸

技术编号:43717200 阅读:17 留言:0更新日期:2024-12-20 12:47
本申请实施例提供一种语音处理方法及相关装置,至少应用于人工智能领域,其中方法包括:获取待处理语音信号的时频特征图;对时频特征图进行不同特征尺度下的特征提取,得到N个特征尺度下的时频特征;N为大于1的整数;基于时频特征图,对N个特征尺度下的时频特征进行时频特征提取,得到待处理语音信号的时频特征;根据时频特征对待处理语音信号进行语音处理。本申请通过对待处理语音信号的时频特征进行提取和分析,能够从多个维度对语音信号进行处理,从而提高语音处理的精度。

【技术实现步骤摘要】

本申请实施例涉及人工智能领域,涉及但不限于一种语音处理方法及相关装置


技术介绍

1、随着人工智能技术的发展,对于语音信号的处理已经成为一个重要的研究课题。相关技术中,在对语音信号进行处理时只考虑到了对时域特征进行提取和分析,而忽略了频域特征的重要性,从而相关技术只能够从单一的维度对语音信号进行处理,降低了语音信号处理的精度。


技术实现思路

1、本申请实施例提供一种语音处理方法及相关装置,至少能够应用于人工智能领域中,通过对待处理语音信号的时频特征进行提取和分析,能够从多个维度对语音信号进行处理,以提高语音处理的精度。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种语音处理方法,包括:获取待处理语音信号的时频特征图;对时频特征图进行不同特征尺度下的特征提取,得到n个特征尺度下的时频特征;n为大于1的整数;基于时频特征图,对n个特征尺度下的时频特征进行时频特征提取,得到待处理语音信号的时频特征;根据时频特征对待处理语音信号进行语音处理。

4、本申请实施例提供一种语音处理装置,包括:获取模块,用于获取待处理语音信号的时频特征图;特征提取模块,用于对所述时频特征图进行不同特征尺度下的特征提取,得到n个特征尺度下的时频特征;n为大于1的整数;特征提取模块,还用于基于所述时频特征图,对所述n个特征尺度下的时频特征进行时频特征提取,得到所述待处理语音信号的时频特征;语音处理模块,用于根据所述时频特征对所述待处理语音信号进行语音处理。>

5、本申请实施例提供一种电子设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现上述的语音处理方法。

6、本申请实施例提供一种计算机程序产品,该计算机程序产品包括可执行指令,可执行指令存储在计算机可读存储介质中;其中,电子设备的处理器从计算机可读存储介质中读取可执行指令,并执行可执行指令时,实现上述的语音处理方法。

7、本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行所述可执行指令时,实现上述的语音处理方法。

8、上述方案具有以下有益效果:

9、在进行语音处理时,首先,获取待处理语音信号的时频特征图;然后,对时频特征图进行不同特征尺度下的特征提取,得到n个特征尺度下的时频特征图;n为大于1的整数;接着,基于时频特征图,对n个特征尺度下的时频特征图进行时频特征提取,得到待处理语音信号的时频特征;最后,根据时频特征对待处理语音信号进行语音处理。由此可见,本申请实施例的语音处理方法,是通过对待处理语音信号的时频特征进行提取和分析,实现对语音信号的处理,由于时频特征是针对语音信号在时间域和频率域上进行提取得到的特征,所以,本申请实施例的语音处理方法可以从多个维度对语音信号进行处理,从而提高语音处理的精度。

本文档来自技高网...

【技术保护点】

1.一种语音处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述时频特征图进行不同特征尺度下的特征提取,得到N个特征尺度下的时频特征,包括:

3.根据权利要求1所述的方法,其特征在于,一个特征尺度对应一个时频特征提取模块,所述基于所述时频特征图,对所述N个特征尺度下的时频特征进行时频特征提取,得到所述待处理语音信号的时频特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一个特征尺度对应的时频特征提取模块包括第一时频模块、卷积层以及池化层;所述通过第一个特征尺度对应的时频特征提取模块对所述时频特征图与第一个特征尺度下的时频特征进行时频特征提取,得到第一时频特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述通过所述第一时频模块对所述时频特征图与第一个特征尺度下的时频特征进行时频特征提取,得到第一时频子特征,包括:

6.根据权利要求5所述的方法,其特征在于,所述特征提取子模块包括第一特征提取子模块和第二特征提取子模块;所述通过第一时频模块中的特征提取子模块对所述时频特征图与第一个特征尺度下的时频特征进行时域特征提取,得到时域特征,包括:

7.根据权利要求6所述的方法,其特征在于,所述第二特征提取子模块的数量为M,所述第二特征向量的数量为M,所述基于所述第一特征向量和所述第二特征向量确定时域特征,包括:

8.根据权利要求5所述的方法,其特征在于,所述特征处理子模块包括第一特征处理子模块和第二特征处理子模块,所述第二特征处理子模块的数量为K;所述通过第一时频模块中的特征处理子模块对所述转置后的时域特征和所述转置后的第一个特征尺度下的时频特征进行特征提取,得到第一时频子特征,包括:

9.根据权利要求8所述的方法,其特征在于,所述根据所述第二归一化结果确定第一时频子特征,包括:

10.一种语音处理装置,其特征在于,所述装置包括:

11.一种电子设备,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于引起处理器执行所述可执行指令时,实现权利要求1至9任一项所述的语音处理方法。

13.一种计算机程序产品,包括计算机可执行指令或计算机程序,其特征在于,所述计算机可执行指令或计算机程序被处理器执行时实现权利要求1至9任一项所述的语音处理方法。

...

【技术特征摘要】

1.一种语音处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述时频特征图进行不同特征尺度下的特征提取,得到n个特征尺度下的时频特征,包括:

3.根据权利要求1所述的方法,其特征在于,一个特征尺度对应一个时频特征提取模块,所述基于所述时频特征图,对所述n个特征尺度下的时频特征进行时频特征提取,得到所述待处理语音信号的时频特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一个特征尺度对应的时频特征提取模块包括第一时频模块、卷积层以及池化层;所述通过第一个特征尺度对应的时频特征提取模块对所述时频特征图与第一个特征尺度下的时频特征进行时频特征提取,得到第一时频特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述通过所述第一时频模块对所述时频特征图与第一个特征尺度下的时频特征进行时频特征提取,得到第一时频子特征,包括:

6.根据权利要求5所述的方法,其特征在于,所述特征提取子模块包括第一特征提取子模块和第二特征提取子模块;所述通过第一时频模块中的特征提取子模块对所述时频特征图与第一个特征尺度下的时频特征进行时域特征提取,得...

【专利技术属性】
技术研发人员:熊雪军
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1