检索音频的方法、设备和存储介质技术

技术编号：40141406 阅读：8 留言：0更新日期：2024-01-23 23:40

本公开提供了一种检索音频的方法、设备和存储介质，属于音频识别技术领域。采用本公开，在检索音频过程中，检索到的音频集合中如果包括非优质版本的歌曲音频，服务器会将其调整为由优质版本音频组成的音频集合，再基于调整后的音频集合确定检索结果，发送给用户的终端。用户对检索结果中的各个歌曲音频进行试听时，不会因为对非优质版本的歌曲音频的试听而浪费用户的时间，从而提高检索效率。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及音频识别，特别涉及一种检索音频的方法、设备和存储介质。

技术介绍

1、哼唱检索是一种音乐检索方式，哼唱检索根据音乐本身的特征，如音调、旋律和歌词等信息进行检索歌曲。进行哼唱检索时，用户只需要哼唱一小段的音乐或者歌词，就能检索出相应的歌曲。

2、相关技术中，在检索歌曲过程中，会检索到一些非优质版本的音频，如盗版歌曲、低质量翻唱歌曲等等。用户需要对检索结果中的各个音频进行试听来寻找自己想要的音频，然而，对检索结果中非优质版本的音频的试听必然会浪费用户的时间，从而导致检索效率低。

技术实现思路

1、本公开提供了一种检索音频的方法、设备和存储介质，能够解决相关技术的问题。

2、第一方面，提供了一种检索音频的方法，所述方法包括：

3、获取终端发送的待检索音频的检索信息，所述检索信息包括所述待检索音频的特征信息；

4、识别所述待检索音频对应的相似音频，得到音频集合；

5、根据预设信息，对所述音频集合进行调整，得到由优质版本音频组成的调整后的音频集合，其中，所述预设信息根据音频的播放量、发行时间、标签中的至少一种信息确定；

6、基于所述待检索音频的特征信息，确定所述调整后的音频集合中每个音频对应的检索结果起始时间，其中，所述检索结果起始时间用于在所述终端播放对应的音频时作为播放起始时间；

7、向所述终端发送所述调整后的音频集合中的每个音频对应的音频相关信息和检索结果起始时间。

8、在一种可能

9、所述根据预设信息，对所述音频集合进行调整，得到由优质版本音频组成的调整后的音频集合，包括：

10、根据所述预先建立的非优质版本音频与优质版本音频的对应关系，将所述音频集合中的非优质版本音频替换为对应的优质版本音频，得到调整后的音频集合。

11、在一种可能的实现方式中，所述方法还包括：

12、基于音频库中每个音频的特征信息，确定所述音频库中不同音频之间的相似度；

13、基于所述音频库中不同音频之间的相似度，确定多个音频组，其中，同一音频组中的任意两个音频之间的相似度大于相似度阈值；

14、对于每个音频组，确定所述音频组的多个音频中的优质版本音频，如果所述音频组中除所述优质版本音频之外还包括其他音频，则将所述其他音频确定为非优质版本音频；

15、基于确定出的所述非优质版本音频和对应的所述优质版本音频，建立非优质版本音频与优质版本音频的对应关系。

16、在一种可能的实现方式中，所述识别所述待检索音频对应的相似音频，得到音频集合，包括：

17、对于音频库中每个音频，基于所述音频每个分段的特征信息与所述待检索音频的特征信息的相似度，确定所述音频与所述待检索音频的相似度；

18、确定与所述待检索音频的相似度满足指定条件的音频，作为所述待检索音频对应的相似音频，组成音频集合。

19、在一种可能的实现方式中，所述特征信息包括旋律特征和/或歌词特征。

20、在一种可能的实现方式中，所述方法还包括：

21、对于所述调整后的音频集合中的每个音频，确定所述音频每个分段的特征信息与所述待检索音频的特征信息的相似度，确定对应的相似度大于相似度阈值的至少一个目标分段，基于播放时间在先的目标分段，确定检索结果起始时间。

22、在一种可能的实现方式中，所述基于播放时间在先的目标分段，确定检索结果起始时间，包括：

23、确定播放时间在先的目标分段的起始时间，作为检索结果起始时间。

24、在一种可能的实现方式中，所述基于播放时间在先的目标分段，确定检索结果起始时间，包括：

25、确定播放时间在先的目标分段的前一个分段的起始时间，作为检索结果起始时间。

26、在一种可能的实现方式中，所述分段为所述音频的句。

27、第二方面，提供了一种检索音频的装置，所述装置包括：

28、获取模块，用于获取终端发送的待检索音频的检索信息，所述检索信息包括所述待检索音频的特征信息；

29、识别模块，用于识别所述待检索音频对应的相似音频，得到音频集合；

30、调整模块，用于根据预设信息，对所述音频集合进行调整，得到由优质版本音频组成的调整后的音频集合，其中，所述预设信息根据音频的播放量、发行时间、标签中的至少一种信息确定；

31、确定模块，用于基于所述待检索音频的特征信息，确定所述调整后的音频集合中每个音频对应的检索结果起始时间，其中，所述检索结果起始时间用于在所述终端播放对应的音频时作为播放起始时间；

32、反馈模块，用于向所述终端发送所述调整后的音频集合中的每个音频对应的音频相关信息和检索结果起始时间。

33、在一种可能的实现方式中，所述预设信息为预先建立的非优质版本音频与优质版本音频的对应关系；

34、所述调整模块，用于：

35、根据所述预先建立的非优质版本音频与优质版本音频的对应关系，将所述音频集合中的非优质版本音频替换为对应的优质版本音频，得到调整后的音频集合。

36、在一种可能的实现方式中，所述调整模块，还用于：

37、基于音频库中每个音频的特征信息，确定所述音频库中不同音频之间的相似度；

38、基于所述音频库中不同音频之间的相似度，确定多个音频组，其中，同一音频组中的任意两个音频之间的相似度大于相似度阈值；

39、对于每个音频组，确定所述音频组的多个音频中的优质版本音频，如果所述音频组中除所述优质版本音频之外还包括其他音频，则将所述其他音频确定为非优质版本音频；

40、基于确定出的所述非优质版本音频和对应的所述优质版本音频，建立非优质版本音频与优质版本音频的对应关系。

41、在一种可能的实现方式中，所述识别模块，用于：

42、对于音频库中每个音频，基于所述音频每个分段的特征信息与所述待检索音频的特征信息的相似度，确定所述音频与所述待检索音频的相似度；

43、确定与所述待检索音频的相似度满足指定条件的音频，作为所述待检索音频对应的相似音频，组成音频集合。

44、在一种可能的实现方式中，所述特征信息包括旋律特征和/或歌词特征。

45、在一种可能的实现方式中，所述确定模块，还用于：

46、对于所述调整后的音频集合中的每个音频，确定所述音频每个分段的特征信息与所述待检索音频的特征信息的相似度，确定对应的相似度大于相似度阈值的至少一个目标分段，基于播放时间在先的目标分段，确定检索结果起始时间。

47、在一种可能的实现方式中，所述确定模块，用于：

48、确定播放时间在先的目标分段的起始时间，作为检索结果起始时间。

49、在一种本文档来自技高网...

【技术保护点】

1.一种检索音频的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述预设信息为预先建立的非优质版本音频与优质版本音频的对应关系；

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述识别所述待检索音频对应的相似音频，得到音频集合，包括：

5.根据权利要求4所述的方法，其特征在于，所述特征信息包括旋律特征和/或歌词特征。

6.根据权利要求4所述的方法，其特征在于，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述基于播放时间在先的目标分段，确定检索结果起始时间，包括：

8.根据权利要求6所述的方法，其特征在于，所述基于播放时间在先的目标分段，确定检索结果起始时间，包括：

9.根据权利要求4所述的方法，其特征在于，所述分段为所述音频的句。

10.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器用于存储计算机指令；所述处理器执行所述存储器存储的计算机

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序代码，响应于所述计算机程序代码被计算机设备执行，所述计算机设备执行上述权利要求1-9中任一项所述的方法。

...

【技术特征摘要】

1.一种检索音频的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述预设信息为预先建立的非优质版本音频与优质版本音频的对应关系；

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述识别所述待检索音频对应的相似音频，得到音频集合，包括：

5.根据权利要求4所述的方法，其特征在于，所述特征信息包括旋律特征和/或歌词特征。

6.根据权利要求4所述的方法，其特征在于，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述基于播放时间在先的目标分段，确定检索...

【专利技术属性】
技术研发人员：陈颖，龚韬，谭志力，苏斌，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人