对象跟踪及处理制造技术

技术编号：10354161 阅读：145 留言：0更新日期：2014-08-27 10:36

一种方法包含跟踪视频数据的多个帧中的每一者中的对象以产生跟踪结果。所述方法还包含执行根据对象检测器或对象辨识器的多帧时延选择的所述多个帧中的帧的子集的对象处理。所述方法包含组合所述跟踪结果与所述对象处理的输出以产生组合的输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】对象跟踪及处理相关申请案的交叉参考本申请案是基于且主张2012年8月6日申请的第13/567,412号美国申请案及2012年I月6日申请的第61/584，062号美国临时专利申请案的优先权权益，所述申请案的全部内容以引用的方式并入本文中。
本专利技术通常涉及图像处理。
技术介绍
技术的进步导致计算装置越来越小且越来越强大。举例来说，当前存在多种便携式个人计算装置，包含很小、重量轻且易于由用户携带的无线计算装置(例如，便携式无线手机)、个人数字助理(PDA)及寻呼装置。更具体来说，例如蜂窝式手机及因特网协议(IP)手机等便携式无线手机可经由无线网络传达语音及数据包。此外，许多此类无线手机包含并入于其中的其它类型的装置。举例来说，无线手机还可包含数字静态相机、数字摄像机、数字记录器及音频文件播放器。可通过计算装置(例如，无线电话)执行文本检测及辨识以识别已由装置的相机俘获的图像中的文本。有时，俘获的文本可相对于相机运动(例如，在移动车辆上的文本)且可有必要在文本移动时跟踪文本，同时提供文本的准确识别。
技术实现思路
对象处理及跟踪技术可执行对象跟踪及对象处理(例如，对象检测、对象辨识或其任何组合)两者以从视频数据准确地识别对象(例如，文本)且跟踪识别的对象的位置。跟踪及处理的时间可重叠或至少部分重叠(例如，跟踪或跟踪方法的部分可与处理或处理方法的部分并发执行)，且处理文本的结果(例如，文本的检测及/或辨识的结果)可与跟踪的结果组合以产生文本的状态信息。不同于利用单个图像中的文本的定位及辨识的常规文本信息提取技术，所提出的技术可利用视频流中的文本的定位及...

【技术保护点】
一种方法，其包括：跟踪视频数据的多个帧中的每一者中的对象以产生跟踪结果；执行根据对象检测器或对象辨识器的多帧时延选择的所述多个帧中的帧子集的对象处理；及组合所述跟踪结果与所述对象处理的输出以产生组合的输出。

【技术特征摘要】
【国外来华专利技术】2012.01.06 US 61/584,062;2012.08.06 US 13/567,4121.一种方法，其包括: 跟踪视频数据的多个帧中的每一者中的对象以产生跟踪结果；执行根据对象检测器或对象辨识器的多帧时延选择的所述多个帧中的帧子集的对象处理；及组合所述跟踪结果与所述对象处理的输出以产生组合的输出。2.根据权利要求1所述的方法，其中执行所述帧子集的对象处理包含根据所述对象检测器的所述多帧时延执行所述帧子集的对象检测。3.根据权利要求1所述的方法，其中执行所述帧子集的对象处理包含根据所述对象辨识器的所述多帧时延执行所述帧子集的对象辨识。4.根据权利要求1所述的方法，其进一步包括基于所述组合的输出更新所述对象的状态息。5.根据权利要求1所述的方法，其进一步包括基于至少所述跟踪结果或所述对象处理的所述输出更新所述对象的状态信息。6.根据权利要求5所述的方法，其中所述基于所述对象处理的所述输出更新所述对象的状态信息包括利用所述对象处理的当前输出、所述对象处理的先前输出、所述对象的运动历史或其任何组合。7.根据权利要求4所述的方法，其中在对象处理阶段期间执行所述对象处理，且其中在跟踪阶段期间执行所述跟踪。8.根据权利要求7所述的方法，其中所述跟踪阶段及所述对象处理阶段的时间至少部分重叠。9.根据权利要求7所述的方法，其进一步包括组合阶段，其中所述组合阶段包含产生所述组合的输出及更新所述状态信息。10.根据权利要求4所述的方法，其中所述更新的状态信息包含所述对象的位置。11.根据权利要求4所述的方法，其中所述对象对应于文本框，且其中所述更新的状态信息包含所述文本框中的辨识的文本。12.根据权利要求4所述的方法，其进一步包括在图像俘获装置的显示装置处至少部分基于所述对象的所述更新的状态信息显示图像内容。13.根据权利要求1所述的方法，其中组合所述跟踪结果与所述对象处理的所述输出包括关于所述对象处理的所述输出集成所述跟踪结果以获得所述对象的时间信息。14.根据权利要求13所述的方法，其中关于所述对象处理的所述输出集成所述跟踪结果包括使用卡尔曼滤波器、粒子滤波器或扩展卡尔曼滤波器中的至少一者基于所述跟踪结果产生所述对象的位置信息。15.根据权利要求13所述的方法，其中关于所述对象处理的所述输出集成所述跟踪结果包括使用最大似然估计器或最大后验估计器中的至少一者基于所述对象处理的所述输出产生包含所述对象的文本数据的识别信息。16.根据权利要求1所述的方法，其中由图像俘获装置产生所述多个帧，且其中所述图像俘获装置包括相机、视频记录装置、无线装置、便携式电子装置或其任何组合。17.根据权利要求1所述的方法，其进一步包括: 在检测到所述帧子集中的第一帧的所述对象处理已完成之前:估计所述帧子集中的所述第一帧与第二帧之间的所述对象的运动；基于所述估计的运动更新所述对象的状态信息；及基于所述对象的所述更新的状态信息产生输出。18.根据权利要求1所述的方法，其中所述跟踪具有单个帧时延。19.一种设备,其包括: 跟踪器，其经配置以跟踪视频数据的多个帧中的每一者中的对象以产生跟踪结果；对象处理器，其经配置以处理根据所述对象处理器的多帧时延选择的所述多个帧中的帧子集中的所述对象 '及时间滤波器，其经配置以组合所述跟踪器的所述跟踪结果与所述对象处理器的输出以产生组合的输出。20.根据权利要求19所述的设备，其中所述对象处理器包含: 对象检测器，其经配置以检测所述帧子集中的所述对象；及对象辨识器，其经配置以辨识所述帧子集中的所述对象。21.根据权利要求19所述的设备，其中所述时间滤波器经进一步配置以基于所述组合的输出更新所述对象的状态信息。22.根据权利要求21所述的设备，其中所述对象对应于文本框，且其中所述更新的状态...

【专利技术属性】
技术研发人员：丘衡一，延奇宣，百永基，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人