【技术实现步骤摘要】
本申请涉及人工智能领域,具体涉及一种音频识别方法、介质、电子设备及程序产品。
技术介绍
1、随着大模型和个性化语音复刻技术的快速发展,机器合成的人声也越发的自然。人们有时候从人耳听觉上难以分辨出听到电子设备所播放的音频是由机器合成,还是真人发出的,从而导致用户无法辨别音频中内容的真实性,存在安全隐患。
2、当前,机器合成的音频在一些场合,会给人类带来一些安全危害。
3、因此,如何准确判断出音频是机器合成的音频还是真人发出的音频,在很多安全场合具有极大的作用和意义。
技术实现思路
1、为了解决上述问题,本申请提出了一种音频识别方法、介质、电子设备及程序产品,避免无法准确判断出音频是机器合成的音频还是真人发出的音频。
2、第一方面,本申请提供了一种音频识别方法,该方法包括:获取第一音频数据;对第一音频数据进行抑制处理,得到第一处理后数据,其中,抑制处理为对第一音频数据中不属于第一类别音频数据的音频数据进行抑制;基于第一处理后数据与第一音频数据的相似程度,确定
...【技术保护点】
1.一种音频识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一音频数据包括多个音频段;并且,所述对应于所述第一处理后数据与所述第一音频数据的相似程度大于第一阈值,确定所述第一音频数据为第一类别音频数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述第一类别音频数据为人声音频数据,所述第二类别音频数据为伪人声音频数据;
4.根据权利要求1所述的方法,其特征在于,所述对所述第一音频数据进行抑制处理,得到第一处理后数据,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述第
...【技术特征摘要】
1.一种音频识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一音频数据包括多个音频段;并且,所述对应于所述第一处理后数据与所述第一音频数据的相似程度大于第一阈值,确定所述第一音频数据为第一类别音频数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述第一类别音频数据为人声音频数据,所述第二类别音频数据为伪人声音频数据;
4.根据权利要求1所述的方法,其特征在于,所述对所述第一音频数据进行抑制处理,得到第一处理后数据,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述第一音频数据进行抑制处理,得到第一处理后数据,包括:
6.根据权利要求4或5所述的方法,其特征在于,所述第一处理后数据为音频特征数据;并且所述第一处理后数据与所述第一音频数据的相似程度为所述第一处理后数据与所述第一音频特征的相似度。
7.根据权利要求4或5所述的方法...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。