信息处理装置、方法以及程序制造方法及图纸

技术编号:30777735 阅读:16 留言:0更新日期:2021-11-16 07:37
本技术涉及使得能够更容易和更高速进行搜索的信息处理装置、方法以及程序。信息处理装置配备有控制单元,该控制单元指定该指定声源以及包括多个声源的声音的音频信号的指定区段,并且获得作为相似于指定声源信号的声源信号并且已经基于音频信号在指定区段中的指定声源的信号被搜索的搜索结果。本技术可以应用于信息处理装置。用于信息处理装置。用于信息处理装置。

【技术实现步骤摘要】
【国外来华专利技术】信息处理装置、方法以及程序


[0001]本技术涉及信息处理装置、方法以及程序,并且更具体地,涉及能够更容易和更高速进行搜索的信息处理装置、方法以及程序。

技术介绍

[0002]在一段音乐的制作现场,通常使用预先单独录制并选录的多个声源,即音频信号,并且通过将它们组合在一起来创作一段音乐。
[0003]过去,通常有少量的声源,并且创作者简单地选择诸如具有不同音色的合成器和敲击乐器的声源。然而,近年来,可以使用的声源如弦乐器和音效的数量急剧增加。
[0004]例如,在声源数据库中,诸如乐器名称、诸如放大器的装置名称、效果器类型或调整参数的关键字被标记到每个声源。创作者指定关键字,并且能够在声源数据库中搜索到期望的声源。
[0005]另一方面,作为声源的搜索方法,还有通过对照(匹配法)在声源数据库中搜索与手头的声源相似的声源的方法。
[0006]通过使用这样的方法,创作者能够通过使用音乐或录声源找到与自己拥有的音乐或录声源相似的声源。
[0007]例如,作为与音频信号的对照相关的技术,已经提出了一种将音乐的音调转换为特征量,并且基于该特征量进行与数据库的对照以识别该音乐的技术(例如,参见专利文献1)。
[0008]此外,还提出了一种对用户通过麦克风输入的哼唱进行音高检测,并基于检测结果来搜索相似音乐的数据库的技术(例如,参见专利文献2)。在该技术中,通过搜索获得的音乐在用户的哼唱之后被再现。
[0009]引文列表
[0010]专利文献
[0011]专利文献1:日本专利第5732994号
[0012]专利文献2:日本专利申请公开第2013

117688号

技术实现思路

[0013]本专利技术要解决的问题是:
[0014]然而,在上述技术中,难以容易且高速地搜索期望声源的信号。
[0015]在声源数据库中通常存储数千个至数十万个声源的音频信号。因此,对于创作者等人基于关键字从所存储的声源找出相似声源的工作将花费较长时间。
[0016]在这种情况下,在进行搜索的创作者等人知道期望的声源与每个关键字之间的连接的情况下,可以在一定程度上缩小候选声源。
[0017]具体地,例如,在创作者等人期望通过搜索找到预定的吉他声音,并且创作者等人具有关于吉他的音色与每个关键字之间的关系的知识的情况下,创作者等人能够缩小成为
候选的声源。
[0018]然而,创作者等人没有足够的知识来为创作者等人期望使用的所有声源指定适当的关键字。因此,考虑到创作者等人,常常难以找出与图像匹配的声源。
[0019]此外,吉他等声音中存在多种音色,即使可以在一定程度上缩小候选,也限制了提高搜索效率的效果。
[0020]此外,在通过使用创作者等人手中的音乐等与声源数据库对照来搜索期望的声源的情况下,手中的音乐等通常不仅包括期望的声源的声音,还包括各种声源的声音。
[0021]使用这样的多个声源的混合声音大大降低了与声源数据库对照的准确性,并且难以根据创作者等人找到与图像匹配的声源。
[0022]具体地,例如,在专利文献1中描述的技术中,提取音乐的音调分量作为特征量,但是该音乐的大部分音调分量是声乐旋律和音乐旋律的主要旋律。
[0023]因此,例如即使在使用专利文献1所记载的技术来与声源数据库对照的情况下,也难以通过使用手头的音乐等来找到除了声乐主旋律和音乐旋律之外的吉他等的声源。
[0024]而且,在这种情况下,难以对照吉他的音色等。因此,创作者等人必须针对通过搜索获得的每个声源再现声源,并确认声源是否与作为创作者等人脑中的图像的音色相匹配。
[0025]此外,例如,专利文献2中描述的技术可以用于搜索相似于已经输入的哼唱的旋律的声源。
[0026]然而,在专利文献2中描述的技术中,不能搜索和声或唯一音色的声源,并且另外,根据声源,例如敲击、声音效果和环境声音,可能难以进行哼唱输入。
[0027]本技术是鉴于上述情况而提出的,其目的在于能够更容易且更高速进行搜索。
[0028]问题的解决方案
[0029]根据本技术的一个方面的信息处理装置包括控制单元,控制单元被配置为指定包括多个声源的声音的音频信号的指定区段和指定声源,并且被配置为获得与指定声源的信号相似的声源信号的搜索结果,声源信号的搜索结果是基于音频信号在指定区段中的指定声源的信号被搜索出的。
[0030]根据本技术的一个方面的信息处理方法或程序包括指定包括如下步骤:指定包括多个声源的声音的音频信号的指定区段和指定声源,并且获得与指定声源的信号相似的声源信号的搜索结果,声源信号的搜索结果是基于音频信号在指定区段中的指定声源的信号被搜索出的。
[0031]根据本技术的一个方面,指定包括多个声源的声音的音频信号的指定区段和指定声源,并且获得与指定声源的信号相似的声源信号的搜索结果,声源信号的搜索结果是基于音频信号在指定区段中的指定声源的信号被搜索出的。
附图说明
[0032][图1]是表示信息处理装置的配置示例的图示。
[0033][图2]是用于描述声源搜索处理的流程图。
[0034][图3]是示出显示屏示例的图示。
[0035][图4]是示出显示屏示例的图示。
[0036][图5]是示出显示屏示例的图示。
[0037][图6]是示出显示屏示例的图示。
[0038][图7]是示出显示屏示例的图示。
[0039][图8]是示出显示屏示例的图示。
[0040][图9]是示出显示屏示例的图示。
[0041][图10]是表示信息处理装置的构造示例的图示。
[0042][图11]是表示声源搜索处理的流程图。
[0043][图12]是示出显示屏示例的图示。
[0044][图13是表示信息处理装置的构造示例的图示。
[0045][图14]是表示声源搜索处理的流程图。
[0046][图15]是表示声源搜索系统的配置示例的图示。
[0047][图16]是表示声源搜索系统的配置示例的图示。
[0048][图17]是表示声源搜索系统的配置示例的图示。
[0049][图18]是表示计算机的配置示例的图示。
具体实施方式
[0050]在下文中,将参考附图描述应用本技术的实施例。
[0051]<第一实施例>
[0052]<关于本技术>
[0053]在本技术中,使用包括乐器等的声源的声音的音乐来进行声源分离,乐器等的声源是创作者等人脑中的图像,从而可以容易且高速地在声源数据库中搜索与声源相似的声源的信号。
[0054]即,在本技术中,包括声源或录制的声音的音乐的音频信号(以下,也称为输入音频信号)用于与构成声源数据库的多个声源的声源信号对照,声源或录制的声音是用户希望搜本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信息处理装置,包括:控制单元,被配置为指定包括多个声源的声音的音频信号的指定区段和指定声源,并且被配置为获得与所述指定声源的信号相似的声源信号的搜索结果,所述声源信号的所述搜索结果是基于所述音频信号在所述指定区段中的所述指定声源的信号被搜索出的。2.根据权利要求1所述的信息处理装置,其中,所述指定声源的信号包括通过对所述音频信号的所述指定区段的裁剪以及声源分离而获得的分离信号。3.根据权利要求2所述的信息处理装置,其中,所述指定声源的信号包括通过所述声源分离将已经被指定为所述指定声源的声源的信号与所述音频信号分离而获得的分离信号。4.根据权利要求3所述的信息处理装置,其中,所述控制单元显示作为所述指定声源的候选的多个候选声源的列表,并且将所述多个候选声源中已经由用户指定的候选声源指定为所述指定声源。5.根据权利要求2所述的信息处理装置,其中,所述指定声源的信号包括由用户从通过所述声源分离获得的多个分离信号中指定的所述分离信号。6.根据权利要求5所述的信息处理装置,其中,所述控制单元使得显示通过所述声源分离获得的所述多个分离信号的声源的列表,并且将所述用户从所述列表中指示的声源中...

【专利技术属性】
技术研发人员:大迫庆一光藤祐基
申请(专利权)人:索尼集团公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1