【技术实现步骤摘要】
【国外来华专利技术】标识音乐中的语言
[0001]相关申请的交叉引用
[0002]本申请要求于2021年2月26日提交的题为“Training method and system of automatic music language identification using audio and metadata”的美国非临时专利申请17/186,490的优先权,该申请通过引用并入本文,如同其整体被再现一样。
技术介绍
[0003]典型的语言标识技术确定与讲话相关联的语言。然而,用于标识讲话中的语言的技术不适用于标识音乐中的语言。例如,由于讲话表达与歌唱之间的差异,用于标识讲话中的语言的技术可能不适用于标识音乐中的语言。因此,需要改进语言标识技术。
附图说明
[0004]并入本说明书中并且构成本说明书的一部分的附图示出了实施例,并且与说明书一起用于解释方法和系统的原理:
[0005]图1是示出根据本公开使用的示例系统的示意图。
[0006]图2示出了可以根据本公开使用的用于测试语言标识模型的示例过程。
[0007] ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:接收音乐片段的音频数据或与所述音乐片段相关联的元数据中的至少一项;以及使用模型基于所述音乐片段的所述音频数据或与所述音乐片段相关联的所述元数据中的所述至少一项来确定与所述音乐片段相关联的语言;其中所述模型是使用训练数据而被训练的,所述训练数据包括指示表示多个音乐样本的音频数据的信息和与所述多个音乐样本相关联的元数据,并且所述训练数据还包括指示与所述多个音乐样本中的每个音乐样本相对应的语言的信息。2.根据权利要求1所述的方法,还包括:通过预处理所述音乐片段的所述音频数据来生成表示所述音乐片段的所述音频数据的提取特征的图像;以及通过预处理与所述音乐片段相关联的所述元数据来生成表示与所述音乐片段相关联的所述元数据的提取特征的数值。3.根据权利要求2所述的方法,其中表示所述音乐片段的所述音频数据的提取特征的所述图像包括表示所述音乐片段的音频信号的频率如何随时间变化的谱图。4.根据权利要求1所述的方法,其中使用所述模型来确定与所述音乐片段相关联的语言包括:基于所述音乐片段的所述音频数据生成表示所述音乐片段的所述音频数据的第一向量;基于与所述音乐片段相关联的所述元数据生成表示与所述音乐片段相关联的所述元数据的第二向量;以及基于所述第一向量和所述第二向量来确定与所述音乐片段相关联的所述语言。5.根据权利要求4所述的方法,其中基于所述第一向量和所述第二向量来确定与所述音乐片段相关联的所述语言还包括:拼接所述第一向量和所述第二向量;以及输出指示与所述音乐片段相关联的所述语言的信息。6.根据权利要求1所述的方法,其中所述音乐片段的所述音频数据包括指示所述音乐片段的人声音轨的信息和指示所述音乐片段的器乐音轨的信息。7.根据权利要求1所述的方法,其中与所述音乐片段相关联的所述元数据包括歌曲标题、专辑名称、艺术家名称或标识号中的至少一项。8.一种系统,包括:至少一个处理器;以及至少一个存储器,通信耦合到所述至少一个处理器并且存储指令,所述指令在由所述至少一个处理器执行时使所述系统执行操作,所述操作包括:接收音乐片段的音频数据或与所述音乐片段相关联的元数据中的至少一项;以及使用模型基于所述音乐片段的所述音频数据或与所述音乐片段相关联的所述元数据中的所述至少一项来确定与所述音乐片段相关联的语言,其中所述模型是使用训练数据而被训练的,所述训练数据包括指示表示多个音乐样本的音频数据的信息和与所述多个音乐样本相关联的元数据,并且所述训练数据还包括指示与所述多个音乐样本中的每个音乐样本相对应的语言的信息。
9.根据权利要求8所述的系统,还包括:通过预处理所述音乐片段的所述音频数据来生成表示所述音乐片段的所述音频数据的提取特征的图像;以及通过预处理与所述音乐片段相关联的所述元数据来生成表示与所述音乐片段相关联的所述元数据的提取特征的数值。10.根据权利要求9所述的系统,其中表示所述音乐片段的所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。