当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理设备、信息处理方法和程序技术

技术编号:18467369 阅读:28 留言:0更新日期:2018-07-18 16:44
[目的]使得声音收集部的数量的减少与声源方向的估计的分辨力改善两者是兼容的。一种信息处理设备,包括:获取单元,其被配置成获取由声音收集部获得的来自一个或多个声源中的每一个的声音的声音收集结果,所述声音收集部的指示位置和方向中的至少一个的位置信息被改变;以及估计单元,其被配置成基于由所述声音收集部收集的声音的频率变化来估计所述一个或多个声源中的每一个的方向,所述频率变化与所述声音收集部的所述位置信息的变化相关联。

Information processing equipment, information processing methods and programs

[Objective] the reduction of the number of sound collection units is compatible with the improvement of the estimation of sound source direction. An information processing device, including: an acquisition unit configured to obtain sound collection results from sound from one or more sound sources obtained by the sound collection unit, and at least one position information in the direction and direction of the sound collection unit is changed; and the estimation unit is configured. Based on the frequency change of the sound collected by the sound collection unit, the direction of each of the one or more sound sources is estimated, and the frequency change is associated with the change of the position information described by the sound collection unit.

【技术实现步骤摘要】
【国外来华专利技术】信息处理设备、信息处理方法和程序
本公开涉及一种信息处理设备、信息处理方法和程序。
技术介绍
近年来,随着所谓的语音识别技术和声音分析技术的进步,多种信息处理设备能够识别使用用户发出的语音或来自附近声源的声音作为输入信息的状态或情形,并且根据识别结果来执行进行。在这些信息处理设备中,已提出这样的信息处理设备,其基于语音或声音的收集结果来估计声音的到达方向(即,声源的方向)并将估计结果馈送回多个进程,诸如噪声抑制和对目标声音的识别精度的改善。例如,专利文献1公开了用于基于多个麦克风中的每一个(以下也称为“声音收集部”)的收集结果来估计声音的到达方向的技术的实例。引用清单专利文献专利文献1:JP2011-61422A
技术实现思路
技术问题作为用于估计声音的到达方向的结构的实例,可例示出使用多个声音收集部中的每一个的声音收集结果的技术,诸如专利文献1中公开的技术。在该技术中,波束形成的主波瓣的宽度或与声音的到达方向的估计有关的分辨力取决于声音收集部的间隔或数量,并且在一些情况下需要以高密度安装的许多声音收集部来在更宽频带下获得更高分辨力。另一方面,声音收集部的数量的增加导致增加各种成本,诸如声音收集部的成本、布线的成本、维护的成本以及在一些情况下针对声音收集部之间的特性变化的对策。另外,在一些情况下,设备的重量随着声音收集部数量的增加而增加。因此,本公开提出了一种信息处理设备、信息处理方法和程序,其中声音收集部的数量的减少与声源方向的估计的分辨力改善两者是兼容的。问题解决方案根据本公开,提供了一种信息处理设备,包括:获取单元,其被配置成获取由声音收集部获得的来自一个或多个声源中的每一个的声音的声音收集结果,所述声音收集部的指示位置和方向中的至少一个的位置信息被改变;以及估计单元,其被配置成基于由所述声音收集部收集的声音的频率变化来估计一个或多个声源中的每一个的方向,所述频率变化与所述声音收集部的位置信息的变化相关联。另外,根据本公开,提供了一种信息处理方法,包括:获取由声音收集部获得的来自一个或多个声源中的每一个的声音的声音收集结果,所述声音收集部的指示位置和方向中的至少一个的位置信息被改变;以及由处理器基于由所述声音收集部收集的声音的频率变化来估计一个或多个声源中的每一个的方向,所述频率变化与所述声音收集部的位置信息的变化相关联。另外,根据本公开,提供了一种程序,其使得计算机执行以下操作:获取由声音收集部获得的来自一个或多个声源中的每一个的声音的声音收集结果,所述声音收集部的指示位置和方向中的至少一个的位置信息被改变;以及基于由所述声音收集部收集的声音的频率变化来估计一个或多个声源中的每一个的方向,所述频率变化与所述声音收集部的位置信息的变化相关联。专利技术的有利效果根据本公开,如上所述,提供了一种信息处理设备、信息处理方法和程序,其中声音收集部的数量的减少与声源方向的估计的分辨力改善两者是兼容的。注意,上述效果不一定是限制性的。与上述效果一起或代替上述效果,可以实现本说明书中描述的效果中的任何一种效果或可以从本说明书获得的其他效果。附图说明[图1]图1是示出根据本公开的实施例的信息处理系统的示意性系统配置的实例的图。[图2]图2是示出根据实施例的信息处理系统的功能配置的实例的框图。[图3]图3是示意性地示出在声音收集部循环移动的情况下声音收集部与声音之间的空间位置关系的实例的图。[图4]图4是示出从位于互不相同的位置的多个声源中的每一个到达的声音的观测结果的实例的图。[图5]图5是示出在两个声源位于彼此不同的方向上的情况下从每个声源到达的声音的频谱的实例的图。[图6]图6是示出基于图5中以直方图示出的频谱的在声音到达方向上的估计结果的示例性坐标图。[图7]图7是示意性地示出在声源的位置靠近声音收集部的情况下声音收集部与声源的空间位置关系的实例的图。[图8]图8是示出从近侧声源到达的声音的观测结果的实例的图。[图9]图9是示出在利用多普勒效应进行调制时计算相位差的方法的实例的说明图。[图10]图10是示出在利用多普勒效应进行调制时计算相位差的方法的实例的说明图。[图11]图11是示出根据修改实例1的信息处理系统的概况的说明图。[图12]图12是示出多个声音收集部的声音的观测结果的实例的图。[图13]图13是示出基于多个声音收集部中的每一个的声音收集结果计算出的振幅频谱的实例的图。[图14]图14是示出基于多个声音收集部中的每一个的声音收集结果计算出的振幅频谱的另一实例的图。[图15]图15是示出根据修改实例3的信息处理系统的概况的说明图。[图16]图16是示出其中安装有声音收集单元的移动物体的速度和加速度的检测结果的实例的图。[图17]图17是示出根据修改实例4的信息处理系统的概况的说明图。[图18]图18是示出根据实施例的信息处理设备的硬件配置的实例的图。具体实施方式在下文中,(a)将参照附图详细描述本公开的优选实施例。注意,在本说明书和附图中,具有基本相同的功能和结构的结构元件用相同的附图标号标识,并且省略对这些结构元件的重复阐述。另外,将按照以下顺序进行描述。1.配置1.1.系统配置1.2.功能配置2.技术特征2.1.基本原理2.2.声音收集部循环移动并且从声源到达的声音被视为平面波的情况2.3.将来自声音收集部的声源和路径的声音进行一般化的情况2.4.观测点接近声源的情况2.5.声源分离和应用至波束形成3.修改实例3.1.修改实例1:使用多个声音收集部的情况的实例3.2.修改实例2:结合其他方向估计技术3.3.修改实例3:观测点移动的情况的实例3.4.修改实例4:室内应用实例4.硬件配置5.结论<<1.配置>><1.1.系统配置>首先,将描述根据本公开的实施例的信息处理系统的概况。例如,图1是示出根据实施例的信息处理系统的示意性系统配置的实例的图。另外,在对图1所示的实例的描述中,水平面上相互正交的方向被称为x和y方向,垂直方向被称为z方向。如图1中所示,根据实施例的信息处理系统1包括信息处理设备10和声音收集单元30。另外,声音收集单元30包括声音收集部301,支撑部303和驱动部305。支撑部303部分地连接到驱动部305并且由驱动部305驱动以沿着路径L1(圆形路径)旋转。另外,声音收集部301由支撑部303支撑。在此配置中,驱动部305驱动支撑部303,使得支撑部303旋转并且声音收集部301沿着路径L1移动(即,声音收集部301的位置或方向沿着路径L1改变)。声音收集部301包括诸如所谓的麦克风的声音收集设备。另外,声音收集部301可以包括例如多个诸如麦克风阵列的声音收集设备。声音收集部301收集从周边到达的声音并且将基于声音收集结果的声音信号输出到信息处理设备10。例如,在图1示出的实例的情况下,由用户U11和U12发出的语音由声音收集部301收集,并且将基于该语音的声音收集结果的声音信号输出到信息处理设备10。信息处理设备10基于来自声音收集部301的语音或声音(在一些情况下通常称为“声音”)的声音收集结果来获取声音信号,并且基于所获取的声音信号的变化来估计声音的声源相对于声音收集单元30的方本文档来自技高网...

【技术保护点】
1.一种信息处理设备,包括:获取单元,其被配置成获取由声音收集部获得的来自一个或多个声源中的每一个的声音的声音收集结果,所述声音收集部的指示位置和方向中的至少一个的位置信息被改变;以及估计单元,其被配置成基于由所述声音收集部收集的声音的频率变化来估计所述一个或多个声源中的每一个的方向,所述频率变化与所述声音收集部的所述位置信息的变化相关联。

【技术特征摘要】
【国外来华专利技术】2015.11.17 JP 2015-2246591.一种信息处理设备,包括:获取单元,其被配置成获取由声音收集部获得的来自一个或多个声源中的每一个的声音的声音收集结果,所述声音收集部的指示位置和方向中的至少一个的位置信息被改变;以及估计单元,其被配置成基于由所述声音收集部收集的声音的频率变化来估计所述一个或多个声源中的每一个的方向,所述频率变化与所述声音收集部的所述位置信息的变化相关联。2.根据权利要求1所述的信息处理设备,其中所述声音收集部的所述位置信息以预定模式改变。3.根据权利要求2所述的信息处理设备,包括驱动控制单元,所述驱动控制单元被配置成控制以所述预定模式改变所述声音收集部的所述位置信息的驱动部的操作。4.根据权利要求3所述的信息处理设备,其中所述驱动控制单元控制所述驱动部的所述操作,使得所述声音收集部的所述位置信息沿着基本上圆形的预定路径改变。5.根据权利要求1所述的信息处理设备,其中所述估计单元基于所述声音收集部的所述位置信息的所述变化以及由所述声音收集部收集的声音的频谱的时间方向的变化与所述频谱的频率方向的变化之比来估计所述一个或多个声源中的每一个的所述方向。6.根据权利要求1所述的信息处理设备,包括声音控制单元,所述声音控制单元被配置成基于所述一个或多个声源中的每一个的所述方向的估计结果来控制从至少一个方向到达并且被收集的声音的振幅。7.根据权利要求1所述的信息处理设备,其中所述获取单元获取多个所述声音收集部中的每一个所收集的声音的声音收集结果,并且所述估计单元基于由所述多个声音收集部中的每一个收集的声音的所述频率变化来估计所述一个或多个声源中的每一个的方向,所述频率变化与所述多个声音收集部中的每一个的移动相关联。8.根据权利要求1所述的信息处理设备,其中所述声音收集部由预定的移动物体支撑,使得所述位置信息相对于所述移动物体以所述预定模式改变,并且所述估计单元基于所述声音的所述频率变化来估计所述一个或多个声源中的每一个的所述方向,所述频率变化与所述预定的移动物体的位...

【专利技术属性】
技术研发人员:高桥直也光藤祐基
申请(专利权)人:索尼公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1