音频识别方法、介质、电子设备及程序产品技术

技术编号：41538385 阅读：29 留言：0更新日期：2024-06-03 23:17

本申请涉及人工智能领域，具体涉及一种音频识别方法、介质、电子设备及程序产品。该方法中通过对待识别音频数据进行处理，能够使得处理后数据保留人声音频或者伪人声音频，并将生成的人声音频或伪人声音频按照音频段与待识别音频数据进行比对，来判断待识别音频数据中各个音频段是人声音频还是伪人声音频。基于此，避免了对安全存在要求的场景下，无法成功识别出伪人声音频的问题，从而避免用户损失。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能领域，具体涉及一种音频识别方法、介质、电子设备及程序产品。

技术介绍

1、随着大模型和个性化语音复刻技术的快速发展，机器合成的人声也越发的自然。人们有时候从人耳听觉上难以分辨出听到电子设备所播放的音频是由机器合成，还是真人发出的，从而导致用户无法辨别音频中内容的真实性，存在安全隐患。

2、当前，机器合成的音频在一些场合，会给人类带来一些安全危害。

3、因此，如何准确判断出音频是机器合成的音频还是真人发出的音频，在很多安全场合具有极大的作用和意义。

技术实现思路

1、为了解决上述问题，本申请提出了一种音频识别方法、介质、电子设备及程序产品，避免无法准确判断出音频是机器合成的音频还是真人发出的音频。

2、第一方面，本申请提供了一种音频识别方法，该方法包括：获取第一音频数据；对第一音频数据进行抑制处理，得到第一处理后数据，其中，抑制处理为对第一音频数据中不属于第一类别音频数据的音频数据进行抑制；基于第一处理后数据与第一音频数据的相似程度，确定...

【技术保护点】

1.一种音频识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一音频数据包括多个音频段；并且，所述对应于所述第一处理后数据与所述第一音频数据的相似程度大于第一阈值，确定所述第一音频数据为第一类别音频数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一类别音频数据为人声音频数据，所述第二类别音频数据为伪人声音频数据；

4.根据权利要求1所述的方法，其特征在于，所述对所述第一音频数据进行抑制处理，得到第一处理后数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述第一音频数据进行抑制处...

【技术特征摘要】

1.一种音频识别方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，所述第一类别音频数据为人声音频数据，所述第二类别音频数据为伪人声音频数据；

4.根据权利要求1所述的方法，其特征在于，所述对所述第一音频数据进行抑制处理，得到第一处理后数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述第一音频数据进行抑制处理，得到第一处理后数据，包括：

6.根据权利要求4或5所述的方法，其特征在于，所述第一处理后数据为音频特征数据；并且所述第一处理后数据与所述第一音频数据的相似程度为所述第一处理后数据与所述第一音频特征的相似度。

7.根据权利要求4或5所述的方法...

【专利技术属性】
技术研发人员：吴彪，夏日升，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人