System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 音频数据的侵权识别方法、装置、设备及介质制造方法及图纸_技高网

音频数据的侵权识别方法、装置、设备及介质制造方法及图纸

技术编号:40870001 阅读:4 留言:0更新日期:2024-04-08 16:36
本发明专利技术的实施方式提供了一种音频数据的侵权识别方法、装置、设备及介质。通过先从多个候选音频数据中,确定与目标音频数据的整体相似度满足第一阈值范围的第一音频数据、以及整体相似度满足第二阈值范围的第二音频数据,再从第二音频数据中,确定包含目标音频数据的音频片段的第三音频数据,然后从第二音频数据中除第三音频数据之外的第四音频数据中,确定与目标音频数据的歌词相似度满足第三阈值范围的第五音频数据,从而将第一音频数据、第三音频数据、第五音频数据和第四音频数据中除第五音频数据之外的第六音频数据确定为目标音频数据的侵权音频数据,以达到通过分层召回策略实现侵权音频数据识别的效果,提高识别效率和识别准确性。

【技术实现步骤摘要】

本专利技术的实施方式涉及多媒体,更具体地,本专利技术的实施方式涉及一种音频数据的侵权识别方法、装置、设备及介质


技术介绍

1、本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、随着互联网技术的发展,音频数据(如歌曲)版权的保护变得越来越重要。而独家版权作为音频数据版权的一种具体表现形式,可以更加具体、更加明确地实现版权的控制,以将某个音频数据的版权授予给某个特定的音频播放平台(如音频播放应用)。

3、相关技术中,为了防止音频播放平台的独家版权被盗用,可以对外部平台已上线的音频数据进行校验,以确定外部平台已上线的音频数据中是否包括自家独家版权的音频数据。

4、在上述实现过程中,准确识别外部平台已上线的音频数据中是否包括自家独家版权的音频数据,对音频数据的独家版权保护至关重要。


技术实现思路

1、在本上下文中,本专利技术的实施方式期望提供一种音频数据的侵权识别方法、装置、设备及介质,以提高音频数据侵权与否的识别准确性,为保护音乐版权提供有力支撑。

2、在本专利技术实施方式的第一方面中,提供了一种方法音频数据的侵权识别方法,该方法包括:

3、从多个候选音频数据中,确定与目标音频数据的整体相似度满足第一阈值范围的第一音频数据、以及与目标音频数据的整体相似度满足第二阈值范围的第二音频数据;

4、从第二音频数据中,确定包含目标音频数据的音频片段的第三音频数据;

5、从第四音频数据中,确定与目标音频数据的歌词相似度满足第三阈值范围的第五音频数据,第四音频数据为第二音频数据中除第三音频数据之外的音频数据;

6、将第一音频数据、第三音频数据、第五音频数据和第六音频数据确定为目标音频数据的侵权音频数据,第六音频数据为第四音频数据中除第五音频数据之外的音频数据。

7、在本专利技术的一个实施例中,从多个候选音频数据中,确定与目标音频数据的整体相似度满足第一阈值范围的第一音频数据、以及与目标音频数据的整体相似度满足第二阈值范围的第二音频数据,包括:

8、基于目标音频数据以及各个候选音频数据分别进行编码,得到目标音频数据的第一音频向量以及每个候选音频数据的第二音频向量;

9、基于第一音频向量和各个第二音频向量的向量距离,确定目标音频数据和各个候选音频数据之间的整体相似度;

10、基于目标音频数据和各个候选音频数据之间的整体相似度,确定候选音频数据中整体相似度满足第一阈值范围的第一音频数据、以及整体相似度满足第二阈值范围的第二音频数据。

11、在本专利技术的一个实施例中,基于目标音频数据以及各个候选音频数据分别进行编码,得到目标音频数据的第一音频向量以及每个候选音频数据的第二音频向量,包括:

12、将目标音频数据以及各个候选音频数据分别输入至翻唱识别模型,通过翻唱识别模型对目标音频数据以及各个候选音频数据分别进行编码,以输出目标音频数据的第一音频向量以及每个候选音频数据的第二音频向量。

13、在本专利技术的一个实施例中,基于目标音频数据和各个候选音频数据之间的整体相似度,确定候选音频数据中整体相似度满足第一阈值范围的第一音频数据、以及整体相似度满足第二阈值范围的第二音频数据,包括:

14、基于目标音频数据和各个候选音频数据之间的整体相似度,确定候选音频数据中整体相似度大于或等于第一相似度阈值的第一音频数据,并确定候选音频数据中整体相似度大于第二相似度阈值且小于第一相似度阈值的第二音频数据。

15、在本专利技术的一个实施例中,从第二音频数据中,确定包含目标音频数据的音频片段的第三音频数据,包括:

16、获取目标音频数据的各个音频片段的第一指纹信息,对于任一音频片段,第一指纹信息中包括音频片段中第一特征点对应的特征点指纹,第一特征点为音频片段中能量值满足第一条件的特征点,特征点指纹至少包括第一特征点对应的时间和频率;

17、获取每个第二音频数据的第二指纹信息,对于任一第二音频数据,第二指纹信息中包括第二音频数据中第二特征点对应的特征点指纹,第二特征点为第二音频数据中能量值满足第二条件的特征点;

18、确定第一指纹信息和第二指纹信息中所包括的相同频率,基于相同频率在第一指纹信息中对应的时间以及相同频率在第二指纹信息中对应的时间,确定指纹时间差;

19、基于指纹时间差,从第二音频数据中,确定包含目标音频数据的音频片段的第三音频数据。

20、在本专利技术的一个实施例中,获取目标音频数据的各个音频片段的第一指纹信息,包括:

21、按照预设片段时长,将目标音频数据划分为多个音频片段;

22、对于任一音频片段,对音频片段进行分帧处理,得到音频片段的多个第一音频帧;

23、获取每个第一音频帧的对数域频谱特征,以得到音频片段的对数域频谱;

24、对音频片段的对数域频谱进行均值规整,以得到音频片段的频域信息,频域信息用于指示各个时间对应的频率;

25、基于音频片段的频域信息,通过滤波器,确定多个局部最大值点,局部最大值点为滤波器覆盖区域内能量值最大的频率点;

26、通过固定大小的滑窗,从多个局部最大值点中确定多个极值点,作为多个第一特征点;

27、基于第一特征点对应的时间和频率,获取音频片段的第一指纹信息。

28、在本专利技术的一个实施例中,获取每个第二音频数据的第二指纹信息,包括:

29、对于任一第二音频数据,对第二音频数据进行分帧处理,得到第二音频数据的多个音频帧;

30、获取每个音频帧的对数域频谱特征,以得到第二音频数据的对数域频谱;

31、对第二音频数据的对数域频谱进行均值规整,以得到第二音频数据的频域信息,频域信息用于指示各个时间对应的频率;

32、基于第二音频数据的频域信息,通过滤波器,确定多个局部最大值点,局部最大值点为滤波器覆盖区域内能量值最大的频率点;

33、通过固定大小的滑窗,从多个局部最大值点中确定多个极值点,作为多个第二特征点;

34、基于多个第二特征点对应的时间和频率,获取第二音频数据的第二指纹信息。

35、在本专利技术的一个实施例中,基于指纹时间差,从第二音频数据中,确定包含目标音频数据的音频片段的第三音频数据,包括:

36、对于任一第二音频数据,确定第二音频数据对应的多个指纹时间差中出现次数最多的目标指纹时间差;

37、基于目标指纹时间差的出现次数以及目标音频数据所包括的音频片段的个数,确定目标音频数据在第二音频数据中的出现完整度;

38、将出现完整度大于完整度阈值的第二音频数据确定为第三音频数据。

39、在本专利技术的一个实施例中,基于目标指纹时间差的出现次数以及目标音频数据所包括的音频片段的个数,确定目标音频数据在第二音频本文档来自技高网...

【技术保护点】

1.一种音频数据的侵权识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述从多个候选音频数据中,确定与目标音频数据的整体相似度满足第一阈值范围的第一音频数据、以及与所述目标音频数据的整体相似度满足第二阈值范围的第二音频数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述从所述第二音频数据中,确定包含目标音频数据的音频片段的第三音频数据,包括:

4.根据权利要求1所述的方法,其特征在于,所述从第四音频数据中,确定与所述目标音频数据的歌词相似度满足第三阈值范围的第五音频数据,包括:

5.根据权利要求1所述的方法,其特征在于,所述从多个候选音频数据中,确定与目标音频数据的整体相似度满足第一阈值范围的第一音频数据、以及与所述目标音频数据的整体相似度满足第二阈值范围的第二音频数据之前,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述将所述第一音频数据、所述第三音频数据、所述第五音频数据和第六音频数据确定为所述目标音频数据的侵权音频数据之后,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述分别确定所述第一音频数据、所述第三音频数据、所述第五音频数据和第六音频数据的侵权类型,包括:

8.一种音频数据的侵权识别装置,其特征在于,所述装置包括:

9.一种计算设备,其特征在于,所述计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至7中任一项所述的音频数据的侵权识别方法所执行的操作。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有程序,所述程序被处理器执行如权利要求1至7中任一项所述的音频数据的侵权识别方法所执行的操作。

...

【技术特征摘要】

1.一种音频数据的侵权识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述从多个候选音频数据中,确定与目标音频数据的整体相似度满足第一阈值范围的第一音频数据、以及与所述目标音频数据的整体相似度满足第二阈值范围的第二音频数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述从所述第二音频数据中,确定包含目标音频数据的音频片段的第三音频数据,包括:

4.根据权利要求1所述的方法,其特征在于,所述从第四音频数据中,确定与所述目标音频数据的歌词相似度满足第三阈值范围的第五音频数据,包括:

5.根据权利要求1所述的方法,其特征在于,所述从多个候选音频数据中,确定与目标音频数据的整体相似度满足第一阈值范围的第一音频数据、以及与所述目标音频数据的整体相似度满足第二阈值范围的第二音频数据之前,所述方法还包括:

【专利技术属性】
技术研发人员:潘颂声李鹏刘华平赵翔宇金强李宜烜章臻陈锦海
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1