用于基于内容的检索的音频信号的潜在空间表示制造技术

技术编号：38334928 阅读：11 留言：0更新日期：2023-08-02 09:15

提供了一种方法和系统，该方法和系统用于从表现出音高、音色、衰减、混响和其他心理声学属性的变化的数字音频信号中提取特征，并且从提取的特征中学习用于生成数字音频信号的上下文潜在空间表示的人工神经网络模型。还提供了一种方法和系统，该方法和系统用于学习用于生成数字音频信号的一致潜在空间表示的人工神经网络模型，其中生成的潜在空间表示是可比较的，以便确定数字音频信号之间的心理声学相似性。还提供了一种方法和系统，该方法和系统用于从数字音频信号中提取特征，并且从提取的特征中学习用于生成数字音频信号的潜在空间表示的人工神经网络模型，该潜在空间表示负责选择表示信号之间的心理声学差异的信号的突出属性。出属性。出属性。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于基于内容的检索的音频信号的潜在空间表示

[0001]本专利技术涉及用于学习和使用数字音频信号的潜在空间表示的计算机实现的方法和系统，并且更具体地，涉及在基于音频内容的检索的上下文中的此类计算机实现的方法和系统。

技术介绍

[0002]心理声学涵盖对声音空间和人类的声音感知机制的研究。与视觉信息不同，人类通常更难使用客观术语口头地描述声音的某些属性。例如，没有广泛接受的客观术语来描述音色的差异。
[0003]不同的人可能会以不同的方式描述相同的音色。例如，一个人可通过发出声音的乐器来描述音色，另一个人可通过声音的质量和音调来描述音色(例如，响亮、刺耳、笛声、难听、恼人、尖锐等)，并且又一个人可通过声音的情绪来描述音色(例如，兴奋、愤怒、快乐、悲伤等)。其他不容易描述的声音元素、尤其是音乐中的声音元素包括节奏、旋律、力度和统一感。
[0004]尽管有这个困难，但许多现有的音频内容检索计算系统仍是基于关键词的。也就是说，音频内容用描述音频内容的关键词来标记(例如，加索引)。此类计算系统的用户然后使用关键词来搜索或浏览期望的音频内容。
[0005]当音频内容用客观属性(例如，诸如艺术家姓名、歌曲标题、音乐流派、半音阶的音高、每分钟节拍数或其他客观属性)标记/加索引时，关键字标记/索引的效果很好。然而，当用户难以用文字清楚地表达正在寻找的音频内容，或者在心理声学意义上使其对用户突出的期望音频内容的属性是主观的或多因素的时，基于关键字来搜索或浏览音频内容的效果不是很好。例如，用户可能正在寻找听起来像特...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，其包括：读取与特定声音内容类别相关联的一组数字音频信号源中的特定数字音频信号源；基于所述特定数字音频信号来生成时频表示；使用人工神经网络学习提供所述时频表示的潜在空间表示的一组数字代码，其中所述一组数字代码具有小于所述时频表示的维数的维数；对所述特定声音内容类别中的所述一组数字音频信号源中的多个其他数字音频信号源中的每一者重复所述读取、所述生成和所述学习以训练所述人工神经网络；从经训练的人工神经网络中获得一组学习的模型参数；以及将用于所述特定声音内容类别的所述一组学习的模型参数存储在计算机存储介质中。2.如权利要求1所述的方法，其还包括：基于与所述特定声音内容类别相关联的第一数字音频信号来生成第一时频表示；使用所述一组学习的模型参数来计算第一组数字代码，所述第一组数字代码提供所述第一时频表示的潜在空间表示；基于与所述特定声音内容类别相关联的第二数字音频信号来生成第二时频表示；使用所述一组学习的模型参数来计算第二组数字代码，所述第二组数字代码提供所述第二时频表示的潜在空间表示；以及计算所述第一组数字代码与所述第二组数字代码之间的距离。3.如权利要求2所述的方法，其还包括：基于所述距离，致使在计算机图形用户界面中呈现所述第一数字音频信号和所述第二数字音频信号涵盖相似声音的指示。4.如权利要求2所述的方法，其还包括：通过数据通信网络从计算装置接收所述第一数字音频信号；并且其中所述第一数字音频信号由所述计算装置使用所述计算装置的传声器或操作性地耦合到所述计算装置的所述传声器来捕获，所述传声器记录人类可听的演奏。5.如权利要求2所述的方法，其还包括：将所述距离与距离阈值进行比较；以及基于所述距离低于所述距离阈值，致使在计算机图形用户界面中呈现所述第一数字音频信号和所述第二数字音频信号涵盖近似重复的声音的指示。6.如权利要求5所述的方法，其还包括：基于所述特定声音内容类别来选择所述距离阈值。7.如权利要求5所述的方法，其还包括：基于所述第一组数字代码与所述第二组数字代码之间的余弦相似性来计算所述第一组数字代码与所述第二组数字代码之间的所述距离。8.如...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：分散式创作股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人