用于沉浸式视频的经由连续帧中的成对匹配的多相机人物关联制造技术

技术编号：37039644 阅读：15 留言：0更新日期：2023-03-29 19:18

论述了与在多视图视频中执行物体或人类关联或对应关系有关的技术。这种技术包括根据基于帧对之间的双向最小距离对，为距离子矩阵分开优化对应关系子矩阵，来确定特定时间实例的对应关系，跨时间实例生成和融合轨迹片段，并且在这种轨迹片段处理之后，经由离群点物体位置的消除和物体对应关系的重安排来调整对应关系。应关系。应关系。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于沉浸式视频的经由连续帧中的成对匹配的多相机人物关联

技术介绍

[0001]在沉浸式视频和诸如计算机视觉应用之类的其他情境中，若干个相机被安装在感兴趣的场景周围。例如，相机可被安装在运动场周围的体育馆中。利用从相机获得的视频，为视频的每个时间实例的场景生成3D模型(例如，经由点云体积模型或其他表示)。然后可从场景内的虚拟视图生成照片般逼真的视图，来为用户提供沉浸式体验。特别地，这种技术允许了虚拟相机在3D空间中导航，以便在场景内的任何位置从任何视角或角度重放来自场景的动作。
[0002]跟踪场景(例如，场地或球场)中的人(例如，选手)是自动控制虚拟相机的一个关键组成部分，而将来自不同相机视图的同一个人关联在一起是多选手跟踪算法中的一个复杂问题。多相机选手关联将在同一时间戳来自不同相机的同一个人的限界框的检测和跟踪集成在一起。
[0003]要提供来自多个相机的稳定而准确的关联有几个挑战。首先，来自每个相机的检测结果并不完全可靠。在检测中，限界框缺失是很常见的，尤其是当选手挤在一起和发生遮蔽的时候。例如，一个限界框可能覆盖多于一个人(例如，多于三个人)，这导致关联中的人的数目减少。第二，在连续的帧中，检测到的限界框是不稳定的。具体而言，两个相邻的帧可能具有不同数目的限界框，这导致相邻帧中不连续的关联位置。第三，同一个人在不同相机中的图像可能有很大的差异。不同的视角和人物重叠使得匹配变得困难。此外，对实时处理的执行时间也有很强的限制。
[0004]用于来自多个相机的关联的当前技术包括基于几何约束的技术和基于轨迹融合的技术。...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在多视图视频中执行物体关联的系统，包括：存储器，用于存储多个视频帧的每一者的限界框数据，所述多个视频帧的每一者对应于同一时间实例的场景的特定视图；以及与所述存储器耦合的一个或多个处理器，所述一个或多个处理器用于：接收多个视频帧的每一者的限界框数据，所述多个视频帧的每一者对应于同一时间实例的场景的特定视图；基于所述限界框数据生成距离矩阵，所述距离矩阵包括所述视频帧的所有对之间的限界框的可用组合之间的距离；基于所述距离矩阵内的双向最小距离对应关系限界框对，从所述距离矩阵确定多个距离子矩阵；基于优化包括每个对应关系子矩阵和每个距离子矩阵的目标函数，为每个所述距离子矩阵单独确定对应关系子矩阵；并且基于所述对应关系子矩阵为所述视频帧的限界框数据提供关联列表。2.如权利要求1所述的系统，其中，所述双向最小距离对应关系限界框对中的第一双向最小距离对应关系限界框对包括第一视频帧中的第一限界框与第二视频帧中的第二限界框之间的对应关系，其中，所述第一双向最小距离对应关系限界框对响应于所述第二限界框在从所述第一限界框到所述第二视频帧中的所有候选限界框的所有可用距离中具有与所述第一限界框的最小距离，并且所述第一限界框在从所述第二限界框到所述第一视频帧中的所有候选限界框的所有可用距离中具有与所述第二限界框的最小距离。3.如权利要求1所述的系统，其中，所述一个或多个处理器确定所述多个子矩阵包括：所述一个或多个处理器经由行和列初等变换，基于所述双向最小距离对应关系限界框对来变换所述距离矩阵，以在所述子矩阵内合并所述双向最小距离对应关系限界框对。4.如权利要求1至3中的任一项所述的系统，所述一个或多个处理器用于：使用所述同一时间实例作为起始时间帧生成第一轨迹片段集合；使用所述同一时间实例之后的额外时间实例作为起始时间帧生成一个或多个额外轨迹片段集合；并且使用所述第一轨迹片段集合和所述额外轨迹片段集合来调整用于所述时间实例之一的初始关联列表。5.如权利要求4所述的系统，其中，所述第一轨迹片段集合的第一轨迹片段由所述一个或多个处理器通过执行以下操作来生成：将所述同一时间实例的限界框的位置投影到所述同一时间实例之后的第二时间实例的限界框的第二位置；并且响应于组合优化算法的应用和所述第二时间实例的物体位置在所述同一时间实例的物体位置的阈值距离之内，将所述第二时间实例的物体位置添加到所述第一轨迹片段。6.如权利要求4所述的系统，所述一个或多个处理器用于：融合所述第一轨迹片段集合和所述一个或多个额外轨迹片段集合，以生成结果轨迹片段集合。7.如权利要求6所述的系统，其中，所述一个或多个处理器融合所述第一轨迹片段集合和所述一个或多个额外轨迹片段集合包括所述一个或多个处理器执行以下操作：
确定所述一个或多个额外轨迹片段集合中的第二轨迹片段集合中的第二轨迹片段不与所述第一轨迹片段集合中的任何轨迹片段相交；并且响应于所述第二轨迹片段具有超过阈值的长度，将所述第二轨迹片段添加到所述结果轨迹片段集合。8.如权利要求6所述的系统，其中，所述一个或多个处理器融合所述第一轨迹片段集合和所述一个或多个额外轨迹片段集合包括所述一个或多个处理器执行以下操作：确定所述一个或多个额外轨迹片段集合中的第二轨迹片段集合中的第二轨迹片段不与所述第一轨迹片段集合中的任何轨迹片段相交；并且响应于所述第二轨迹片段和结果轨迹片段集合中的第三轨迹片段的长度之和小于与所述同一时间实例和所述额外时间实例相对应的缓冲器大小，而将所述第二轨迹片段与所述第三轨迹片段合并。9.如权利要求1所述的系统，其中，所述一个或多个处理器提供所述关联列表包括：所述一个或多个处理器在所述限界框数据的位置跟踪之后，基于所述关联列表中的物体的位置的比较，调整所述关联列表中的一个或多个物体。10.如权利要求9所述的系统，其中，所述一个或多个处理器调整所述一个或多个物体包括：所述一个或多个处理器响应于第一视频帧中的第一物体限界框与第一物体关联的中心位置的第一距离超过所述第一物体限界框与第二物体关联的中心位置的第二距离，而将所述第一物体限界框的关联从所述第一物体关联改变到所述第二物体关联。11.如权利要求9所述的系统，其中，所述一个或多个处理器调整所述一个或多个物体包括：所述一个或多个处理器响应于第一视频帧中的第一物体限界框大于与第一物体关联位置的阈值距离而丢弃所述第一物体限界框。12.一种用于在多视图视频中执行物体关联的方法，包括：接收多个视频帧的每一者的限界框数据，所述多个视频帧的每一者对应于同一时间实例的场景的特定视图；基于所述...

【专利技术属性】
技术研发人员：方龙伟，栗强，李文龙，方亦凯，郑航，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人