一种音频识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：33622894 阅读：14 留言：0更新日期：2022-06-02 00:48

本公开提供了一种音频识别方法、装置、电子设备、可读存储介质以及计算机程序产品，涉及人工智能、安全认证技术以及声纹识别技术领域。具体实现方案为：基于待识别音频在频域对应的第一音频特征，确定所述待识别音频在实数域对应的第二音频特征；利用目标压缩函数对所述第二音频特征进行特征压缩，获得所述待识别音频对应的非线性音频特征，所述目标压缩函数为预先对可平滑对数压缩函数进行参数学习得到的，所述可平滑对数压缩函数中包括预设的可学习参数；基于所述非线性音频特征，确定所述待识别音频对应的音频识别结果。该方案能够在无需人工提取音频特征的情况下，高效的模拟出待识别音频的非线性，进而能够提高音频识别的安全性和识别效率。安全性和识别效率。安全性和识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频识别方法、装置、电子设备及存储介质

[0001]本公开涉及人工智能领域，进一步涉及安全认证技术、声纹识别
，具体涉及一种音频识别方法、装置、电子设备、可读存储介质以及计算机程序产品。

技术介绍

[0002]随着计算机技术和人工智能技术的快速发展，生物识别技术也得到了快速的推广与发展。生物识别技术作为一种利用人体固有的生物特征来进行个人身份认证的技术，具有不易遗忘以及随时随地可用等优点。
[0003]但是，生物识别技术在应用过程中也会面临安全性低以及识别效率较低等诸多问题。例如：利用使用者的音频特征来进行个人身份认证的音频识别技术，在应用过程中往往会面临恶意欺骗攻击的问题。

技术实现思路

[0004]本公开提供了提供一种音频识别方法、装置、电子设备、可读存储介质以及计算机程序产品，以提高音频识别的安全性和识别效率。
[0005]根据本公开的一方面，提供了一种音频识别方法，该方法可以包括以下步骤：
[0006]基于待识别音频在频域对应的第一音频特征，确定待识别音频在实数域对应的第二音频特征；
[0007]利用目标压缩函数对第二音频特征进行特征压缩，获得待识别音频对应的非线性音频特征，目标压缩函数为预先对可平滑对数压缩函数进行参数学习得到的，可平滑对数压缩函数中包括预设的可学习参数；
[0008]基于非线性音频特征，确定待识别音频对应的音频识别结果根据本公开的第二方面，提供了一种音频识别装置，该装置可以包括：
[0009]第二音频特征确定单元，用...

【技术保护点】

【技术特征摘要】
1.一种音频识别方法，包括：基于待识别音频在频域对应的第一音频特征，确定所述待识别音频在实数域对应的第二音频特征；利用目标压缩函数对所述第二音频特征进行特征压缩，获得所述待识别音频对应的非线性音频特征，所述目标压缩函数为预先对可平滑对数压缩函数进行参数学习得到的，所述可平滑对数压缩函数中包括预设的可学习参数；基于所述非线性音频特征，确定所述待识别音频对应的音频识别结果。2.根据权利要求1所述的方法，其中，所述利用目标压缩函数对所述第二音频特征进行特征压缩，获得所述待识别音频对应的非线性音频特征，包括：对所述第二音频特征进行特征采样，获得所述第二音频特征对应的采样音频特征；将所述采样音频特征输入到所述目标压缩函数中，获得所述非线性音频特征。3.根据权利要求1或2所述的方法，其中，所述目标压缩函数的确定方式，包括：在训练获得目标音频识别模型的过程中，对所述可平滑对数压缩函数进行参数学习，获得所述目标压缩函数；其中，所述目标音频识别模型为基于音频样本以及对应的标注训练得到的模型，用于识别所述待识别音频以获得所述音频识别结果，所述目标压缩函数属于所述目标音频识别模型中用于获得所述非线性音频特征的特征提取层。4.根据权利要求1或2所述的方法，其中，在所述音频识别结果包括用于表示所述待识别音频是否为真实人声的识别结果情况下，所述基于所述非线性音频特征，确定所述待识别音频对应的音频识别结果，包括：基于所述非线性音频特征，确定所述待识别音频为所述真实人声的概率；基于所述概率，确定所述音频识别结果。5.根据权利要求4所述的方法，其中，所述基于所述概率，确定所述音频识别结果，包括：在所述概率满足预设条件的情况下，确定所述待识别音频为所...

【专利技术属性】
技术研发人员：张银辉，赵情恩，熊新雷，陈蓉，梁芸铭，周羊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人