假唱检测方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：30327766 阅读：16 留言：0更新日期：2021-10-10 00:17

本公开的实施方式提供了一种假唱检测方法、装置、电子设备及计算机可读存储介质，涉及计算机技术领域。该方法包括：确定待检测音频对应的待检测音频特征；待检测音频特征通过对待检测音频指纹进行解码处理得到；确定待检测音频对应的参考音频的参考音频特征；参考音频特征通过对参考音频指纹进行解码处理得到；对待检测音频特征与参考音频特征进行相似度计算，以得到音色相似度；将音色相似度与相似度阈值进行对比，根据对比结果确定待检测音频的检测结果。本公开可以提取直播音频对应的音频指纹，在客户端与服务端之间传输，对直播音频进行假唱实时检测。进行假唱实时检测。进行假唱实时检测。

全部详细技术资料下载

【技术实现步骤摘要】
假唱检测方法、装置、电子设备及计算机可读存储介质

[0001]本公开的实施方式涉及计算机
，更具体地，本公开的实施方式涉及假唱检测方法、假唱检测装置、计算机可读存储介质及电子设备。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]目前娱乐方式越来越多，网络直播为用户提供了越来越多的娱乐内容，例如，主播可以通过直播间演唱歌曲，用户可以通过直播间收听主播演唱的歌曲。主播在直播间演唱的优质歌曲片段，作为平台优质内容，将会被优先分发或推荐。目前，通常对主播的演唱进行机器打分，筛选出高分作品作为优先分发的内容，然而，机器打分无法识别主播演唱的歌曲是真实演唱还是放原唱对口型。
[0004]现有的一种基于机器视觉和语音信号处理相结合的假唱检测方法，是将现场录制的多媒体音频信号和视频信号相结合，并进行一系列分析过程后，确定真唱或假唱的结果。

技术实现思路

[0005]但是，现有的假唱检测方法在进行假唱判断时，除需要音频信息外，还需要视频信息；并且存在技术方式实现过程复杂，算法准确度不高，运算效率较低，无法支持实时检测等问题。
[0006]为此，本公开提出一种改进的假唱检测方法，以使在进行假唱检测时，仅需使用音频信息，通过对音频信息的音频指纹进行分析，计算量小，能够实时得出检测结果，并且可以有效提高检测准确率。
[0007]在本上下文中，本公开的实施方式期望提供一种假唱检测方法、假唱...

【技术保护点】

【技术特征摘要】
1.一种假唱检测方法，其特征在于，应用于服务端，包括：确定待检测音频对应的待检测音频特征；所述待检测音频特征通过对待检测音频指纹进行解码处理得到；确定所述待检测音频对应的参考音频的参考音频特征；所述参考音频特征通过对参考音频指纹进行解码处理得到；对所述待检测音频特征与所述参考音频特征进行相似度计算，以得到音色相似度；将所述音色相似度与相似度阈值进行对比，根据对比结果确定所述待检测音频的检测结果；其中，所述待检测音频指纹与所述参考音频指纹是由客户端分别对所述待检测音频与所述参考音频进行音频特征提取与编码处理所得到的。2.根据权利要求1所述的方法，其特征在于，所述待检测音频特征包括待检测梅尔谱，所述参考音频特征包括参考梅尔谱；所述对所述待检测音频特征与所述参考音频特征进行相似度计算，以得到音色相似度，包括：获取预先构建的音频特征提取模型；所述音频特征提取模型基于包含多个表演者标签的测试音频训练得到；将所述待检测梅尔谱与所述参考梅尔谱输入至所述音频特征提取模型，以分别得到对应的待检测特征向量与参考特征向量；计算所述待检测特征向量与所述参考特征向量之间的向量距离，以得到所述音色相似度。3.根据权利要求2所述的方法，其特征在于，所述音频特征提取模型包括多个第一卷积层、与各所述第一卷积层对应的池化层以及第二卷积层；所述将所述待检测梅尔谱与所述参考梅尔谱输入至所述音频特征提取模型，以分别得到对应的待检测特征向量与参考特征向量，包括：由各所述第一卷积层与各所述池化层对所述待检测梅尔谱进行特征提取，得到初始待检测特征；由所述第二卷积层对所述初始待检测特征进行卷积处理，得到所述待检测特征向量；由各所述第一卷积层与各所述池化层对所述参考梅尔谱进行特征提取，得到初始参考特征；由所述第二卷积层对所述初始参考特征进行卷积处理，得到所述参考特征向量。4.一种假唱检测方法，其特征在于，应用于客户端，包括：获取待检测音频，并确定与所述待检测音频对应的参考音频；所述待检测音频基于实时获取的待检测实时音频得到；分别对所述待检测音频与所述参考音频进行音频特征提取，以得到对应的待检测音频特征与参考音频特征；对所述待检测音频特征进行编码处理，以得到对应的待检测音频指纹；对所述参考音频特征进行编码处理，以得到对应的参考音频指纹；将所述待检测音频指纹与所述参考音频指纹发送至服务端，以由服务端对所述待检测音频指纹与所述参考音频指纹进行解码处理，分别得到对应的所述待检测音频特征与所述参考音频特征；对所述待检测音频特征与所述参考音频特征进行相似度计算，得到音色相
似度，以根据所述音色相似度确定所述待检测音频的检测结果。5.根据权利要求4所述的方法，其特征在于，所述待检测音频特征包括待检测梅尔谱，所述参考音频特征包括参考梅尔谱；所述分别对所述待检测音频与所述参考音频进行音频特征提取，以得到对应的待检测音频特征与参考音频特征，包括：确定音...

【专利技术属性】
技术研发人员：高月洁，郑博，刘华平，曹偲，
申请(专利权)人：杭州网易云音乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人