编码器的生成方法、指纹提取方法、介质及电子设备技术

技术编号：33348663 阅读：30 留言：0更新日期：2022-05-08 09:49

本公开涉及一种编码器的生成方法、指纹提取方法、介质及电子设备，所述编码器的生成方法包括：获取多个样本音频；根据所述多个样本音频构造第一组样本以及第一组样本，其中，针对所述第一组样本中的每一条样本，在所述第一组样本中均存在对应的正样本以及负样本；根据所述第一组样本和所述第一组样本对于第一编码器以及第二编码器进行对比训练，训练完成的所述第一编码器能够作为音频指纹提取器输出作为音频的指纹特征的编码向量。本公开得到的训练完成的第一编码器能有效提取音频的指纹特征，得到更准确的音频指纹，进而提高音频检索的准确度。索的准确度。索的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
编码器的生成方法、指纹提取方法、介质及电子设备

[0001]本公开涉及人工智能
，具体地，涉及一种编码器的生成方法、指纹提取方法、介质及电子设备。

技术介绍

[0002]音频指纹是从音频内容中提取出的代表一条音频重要声学信息的紧致数字签名。音频指纹为音频提供了一种唯一性的表示，通过音频指纹可以有效地将一条音频和其他音频区分开来。相关技术中，使用长短期记忆的自动编码器为音频生成音频指纹，并利用该音频指纹完成音频检索任务，例如，从曲库中检索出与该音频相关的其他音频。然而，针对失真音频，通过自动编码器生成的音频指纹无法有效表示该音频，进而降低了音频检索的准确率，无法有效地完成音频检索任务。

技术实现思路

[0003]提供该部分内容以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该部分内容并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面，本公开提供一种编码器的生成方法，包括：
[0005]获取多个样本音频；
[0006]根据所述多个样本音频构造第一组样本以及第一组样本，其中，针对所述第一组样本中的每一条样本，在所述第一组样本中均存在对应的正样本以及负样本；
[0007]根据所述第一组样本和所述第一组样本对于第一编码器以及第二编码器进行对比训练，训练完成的所述第一编码器能够作为音频指纹提取器输出作为音频的指纹特征的编码向量；
[0008]其中，所述第一编码器用于对所述第一...

【技术保护点】

【技术特征摘要】
1.一种编码器的生成方法，其特征在于，包括：获取多个样本音频；根据所述多个样本音频构造第一组样本以及第一组样本，其中，针对所述第一组样本中的每一条样本，在所述第一组样本中均存在对应的正样本以及负样本；根据所述第一组样本和所述第一组样本对于第一编码器以及第二编码器进行对比训练，训练完成的所述第一编码器能够作为音频指纹提取器输出作为音频的指纹特征的编码向量；其中，所述第一编码器用于对所述第一组样本中的样本进行编码，得到对应每一条样本的第一编码向量，所述第二编码器用于对所述第一组样本中的样本进行编码，得到对应每一条样本的第二编码向量；所述对比训练用于使所述第一编码器输出的第一编码向量接近对应的所述正样本的第二编码向量，远离对应的所述负样本的第二编码向量，且所述第二编码器的编码参数逐渐趋向所述第一编码器的编码参数。2.根据权利要求1所述的方法，其特征在于，所述根据所述多个样本音频构造第一组样本以及第一组样本，包括：对多个所述样本音频分别进行第一参数调整以及第二参数调整，得到所述第一组样本以及所述第一组样本，所述第一参数调整和所述第二参数调整对应的调整参数和/或调整方式不完全相同；其中，所述第一组样本中的每一条样本为经过所述第一参数调整后的样本音频，所述第一组样本中的每一条样本为经过所述第二参数调整后的样本音频，针对所述第一组样本中的每一条样本，所述第一组样本中与该样本对应相同样本音频的样本为正样本，其他样本为负样本。3.根据权利要求2所述的方法，其特征在于，所述调整参数包括但不限于以下的至少一种：噪声、音高、速度、滤波参数、回声、增益或衰减的频段、以及音频格式。4.根据权利要求1所述的方法，其特征在于，所述根据所述第一组样本和所述第一组样本对于第一编码器以及第二编码器进行对比训练，包括：根据所述第一编码器对所述第一组样本中的样本进行编码，得到对应每一条样本的第一编码向量，以及根据所述第二编码器对所述第一组样本的样本进行编码，得到对应每一条样本的第二编码向量；基于所述第一编码向量和所述第二编码向量对对比损失函数的损失值进行迭代运算，并基于所述损失值迭代更新所述第一编码器的编码参数，以使所述第一编码器输出的所述第一编码向量接近对应的所述正样本的所述第二编码向量，远离对应的所述负样本的所述第二编码向量，其中，所述损失值用于表征所述第一编码向量以及所述第二编码向量之间的相似度；并，使所述第二编码器的编码参数逐渐趋向所述第一编码器的所述编码参数，直到得到训练完成的所述第一编码器。5.根据权利要求4所述的方法，其特征在于，所述基于所述第一编码向量和所述第二编码向量对对比损失函数的损失值进行迭代运算，...

【专利技术属性】
技术研发人员：于哲松，杜行健，刘铭瑀，朱碧磊，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人