信息处理装置、信息处理方法和程序制造方法及图纸

技术编号：7192382 阅读：225 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及信息处理装置、信息处理方法和程序。该信息处理装置包括：多个信息输入单元，输入实际空间的观察信息；事件检测单元，基于对从信息输入单元输入的信息的分析来生成存在于实际空间中的用户的包括估计位置信息和估计识别(ID)信息的事件信息；以及信息统合处理单元，输入事件信息并且基于输入的事件信息生成各用户的包括位置和用户ID信息的目标信息，以及代表针对事件生成源的概率值的信号信息。这里，信息统合处理单元包括具有识别器的说话源概率计算单元，并且使用说话源概率计算单元中的识别器基于输入信息来计算说话源概率。

全部详细技术资料下载

【技术实现步骤摘要】

本公开内容涉及信息处理装置、信息处理方法和程序，更具体地涉及如下信息处理装置、信息处理方法和程序其通过输入来自外界的诸如图像、语音等信息的输入信息来基于输入信息分析外部环境，并且具体分析说话人的位置、谁正在说话等。
技术介绍
进行在诸如个人、PC(个人计算机)和机器人的信息处理装置之间的交互处理(例如通信处理或者交互处理)的系统被称为人机交互系统。在人机交互系统中，诸如PC、机器人等信息处理装置通过输入图像信息或者语音信息来基于输入信息进行分析以识别人类动作，比如人类行为或者言语。在个人发送信息的情况下，使用用于手势、注视、面部表情等以及言语的各种渠道作为信息发送渠道。当能够在机器中分析这些渠道时，即使在人与机器之间的交流也可以达到与人之间的交流水平相同的水平。能够分析来自这些多渠道(也称为形态或模态)的输入信息的接口被称为多形态接口，并且已经广泛进行针对接口的开发和研究。例如当通过输入由相机捕获的图像信息和由麦克风获得的声音信息来进行分析时，为了更具体进行分析，从布置在各点的多个相机和多个麦克风输入大量信息是有效的。作为具体系统，例如假设以下系统。信息处理装置(电视机)经由相机和麦克风输入电视机前面的用户(父亲、母亲、姐姐和弟弟)的图像和语音，并且分析各用户的位置、哪个用户说话等，从而可以实现如下系统，该系统能够进行根据分析信息的处理，如关于已经说话的用户的相机推近，关于已经说话的用户进行适当的响应等。作为公开现有人机交互系统的有关领域，例如给出公开号为2009-31951的日本待审专利申请和公开号为2009-140366的日本待审专利申请。在这一有...

【技术保护点】
１．一种信息处理装置，包括：多个信息输入单元，输入实际空间的观察信息；事件检测单元，基于对从所述信息输入单元输入的信息的分析来生成包括存在于实际空间中的用户的估计位置信息和估计识别信息的事件信息；以及信息统合处理单元，输入所述事件信息，并且基于输入的所述事件信息生成包括各用户的位置和用户识别信息的目标信息以及代表针对事件生成源的概率值的信号信息，其中所述信息统合处理单元包括具有识别器的说话源概率计算单元，并且使用所述说话源概率计算单元中的所述识别器来计算基于输入信息的说话源概率。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：山田敬一，泽田务，
申请(专利权)人：索尼公司，
类型：发明
国别省市：JP

全部详细技术资料下载我是这个专利的主人