来自多个视听源的信息的合成制造技术

技术编号：6963896 阅读：170 留言：0更新日期：2012-04-11 18:40

公开了用于合成从聚焦于单个场景的多个音频和可视源接收到的信息的系统和方法。该系统可以基于在捕捉设备的图像数据中标识的共同的线索集合来确定捕捉设备的位置。由于场景常常可以具有移进移出场景的用户和对象，可以使来自多个捕捉设备的数据在时间上同步，以确保来自音频和可视源的数据在相同时间提供同一场景的数据。可以一起协调和吸收来自多个源的音频和/或可视数据，以改进系统的从场景解释音频和/或可视方面的能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息合成系统，尤其涉及用于合成从聚焦于单个场景的多个音频和可视源接收到的信息的系统。背景在过去，诸如计算机游戏和多媒体应用等计算应用使用控制器、遥控器、键盘、鼠标等来允许用户操纵游戏人物或应用的其他方面。近来，计算机游戏和多媒体应用已开始使用照相机和软件姿势识别引擎来提供自然用户界面(“NUI”)。对于NUI，使用捕捉设备来检测用户移动、姿势和语音。相关联的视听数据被转发至处理器，该处理器解释该数据并使用该数据来控制游戏人物或者应用程序的其他方面。当前NUI系统可以使用单个捕捉设备来记录来自玩游戏空间或场景的数据。然而，可能需要增大玩游戏空间或场景的大小。在此情况下，使用单个捕捉设备可能由于许多原因而不适合，诸如，例如，分辨率或场景的照明度不够，或对象在场景内被遮蔽。对于这样的情况，使用一个以上的捕捉设备将是有利的。需要一种系统来合成来自拍摄一个共同的场景的多个捕捉设备的数据，以协调来自多个源的数据。
技术实现思路
此处公开了用于合成从聚焦于单个场景的多个音频和可视源接收到的信息的系统。该系统可包括从两个或更多源接收数据的计算环境。源可以是用于从玩游戏空间或场景捕捉音频和/或可视数据的捕捉设备。本技术的各实施方式首先将捕捉设备彼此校准以及与场景校准。场景常常可以具有移进移出场景的用户和对象。如此，校准过程的第一阶段可包括时间同步来自多个捕捉设备的数据，以确保来自音频和可视源的数据在相同时间提供同一场景的数据。此后，可以通过标识各种捕捉设备的图像数据内的关键点不连续性或线索来将捕捉设备彼此校准。然后，可以通过标识两个或更多捕捉设备的图像所共有...

【技术保护点】
１．一种用于合成来自多个源（２０）的关于场景的信息的方法，包括：ａ）从第一源（２０）和第二源（２０）接收（步骤４４０，４６０）场景信息，所述第一和第二源（２０）在空间上彼此并与所述场景是分开的；ｂ）根据所述场景信息以及由所述第一和第二源从所述场景中共同检测到的一个或多个线索来确定（４０４）所述第一和第二源（２０）中的每一个的位置；ｃ）基于在所述步骤ｂ）中确定的所述第一和第二源（２０）的位置，以及从所述第一和第二源接收到的信息来创建所述场景的表示（步骤４７０）。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：J·A·塔迪夫，K·S·佩雷，A·AA·基普曼，D·易，
申请(专利权)人：微软公司，
类型：发明
国别省市：US

全部详细技术资料下载我是这个专利的主人