图像处理以为图像中的对象进行分类的方法和系统技术方案

技术编号:7515097 阅读:186 留言:0更新日期:2012-07-11 21:22
在图像处理方法中,对象(305)位于图像中,基于图像在该区域内的信息,确定对象(305)周围的区域(325)并将其至少分为第一和第二部分。并可以基于区域的第一部分中的图像信息和区域的第二部分的图像信息对该对象(305)进行分类。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术与一般的图像处理相关,在特定实施例中,与用于在图像中区分对象的方法和系统相关。
技术介绍
已经开发了用于定义视频中的对象、并通过视频的帧来跟踪对象的系统和方法。 在各种应用程序中,人可能即是要被跟踪的“对象”。例如,运动图像用于跟踪人的运动(例如运动员和和/或裁判员)。运动员和裁判员显示在运动视频中。可以在IPTV系统中定位和标记它们,以便常规TV广播(MPEG-2/-4)可以藉由额外信息(已解码的MPEG-7,用于在视频中定义这些对象)以及将要显示的额外的内容(当选择它们时)来增强其功能。具有额外内容(元数据)的对象的规范,通常通过创作工具予以实现,例如抽取截图和关键帧的功能、交互区域的规范以及跟踪特定区域以获取所有帧中的区域。已经通过单击超视频中的运动员或iTV讨论了基于组分类的交互服务。组信息搜索和检索以及组数据(统计结果、文章和其他媒体)可以通过假设运动员可以通过交互服务系统来定位,而链接起来。用于定位运动员/裁判员的各种方法可以分为两组。第一组在受控环境中利用固定相机(通常经过提前校验),第二组仅使用常规的广播视频。前者可以提供更好的性能,而后者的灵活性更高。在第二组中,尝试使用一些以下方法来克服困难 先找到运动场,通过使用颜色分段和使用形态计算的后处理(例如已连接的组件分析), 以便限制搜索区域。
技术实现思路
根据本专利技术的第一个实施例,执行了图像处理方法(例如“在处理器上执行”)。 对象位于图像中,如视频或静态图像中。基于图像在该区域内的信息,确定对象周围的区域并将其至少分为第一和第二部分。然后,对象可以基于区域的第一部分中的图像信息和区域的第二部分的图像信息进行分类。在另一个实施例中,交互式电视系统包含用于接收视频图像的创作工具,在图像中定位对象,将对象周围的区域分为第一和第二部分;并基于第一部分中的第一图像信息以及第二部分中的第二图像信息来生成元数据。用于接收视频图像和元数据的聚合器,并生成利用元数据增强的视频流,并且,分发系统用于传送利用元数据增强的视频流。附图简述为了更完整地了解本专利技术及其优势,因此,可以参考以下参考和附图,其中附图说明图1为根据本专利技术的一个实施例、基于组分类的交互系统的结构图;图2为基于运动场模式的运动员/裁判员位置、根据本专利技术的一个实施例的流程图;图3为根据本专利技术的一个实施例,对运动员“炸弹”进行垂直切割的示例图像;图4为根据本专利技术的一个实施例、基于交互电视系统的结构图;图5-7为交互电视系统的示例的屏幕快照。具体实施例方式下面详细讨论了本专利技术优选实施例的制造和使用过程。但是,应该感谢本专利技术,它提供了许多可应用的专利技术概念,可以在大量特定环境中实施。所讨论的这些特定实施例仅说明了制造和使用本专利技术的特定方式,并不是本专利技术的全部范围。运动员/裁判员的组分类用于区分其标识(“组A”或“组B”或“裁判员”)。本任务的问题包括特征的选择以及匹配的聚集方法。已经使用了模板和直方图方法。特征选择是基于不同级别、稳健性和计算成本的区别。直方图是这些要求之间的折中方法。聚集方法可以是受监控的,也可以是不受监控的。本专利技术可以同时提高直方图匹配中的特征提取和区分的效率。在第一个实施例中,本专利技术揭示了基于IPTV系统的交互服务的运动组,包括实时和点播的视频传输。例如,实时处理运动事件视频,以及实时分析和分类组/裁判员的视觉对象。提出了一个用于通过区分功能,将运动员/裁判员的图斑(blob)(利用基于运动场模型分片获取)分为两部分(上和下)的多直方图匹配架构和方法。该架构可以获取良好的分类准确定,而计算的复杂性却很低。当单击运动员时,基于组分类的交互功能包括组信息搜索和检索以及组数据(统计结果、文章和其他媒体)链接。建议的组分类方法对于IPTV 系统中的运动程序,在运动事件、策略分析以及交互服务运动程序中具有潜在的用途。在其他实施例中,提供了一种用于IPTV系统中的运动程序的推荐的基于组分类的交互服务。在其他实施例中,提供了在足球运动视频中基于多直方图匹配架构的用于运动员/裁判员的组分类的方法,它提供了更好的分类准确定,同时计算复杂性较低。在另一个实施例中,说明了一个可用于通过建议的区分功能将运动员/裁判员的图斑(通过基于运动场模型分片获取)分为两部分(上和下)的方法。在超链接视频中,可以选择对象,并导致相关动作,类似于与相关对象有关的已链接的富媒体内容。使用超链接视频可能的场合包括广播TV、流视频和已发布的媒体(如 DVD)。超链接视频提供了使用流媒体进行交互操作的新的可能性。随着广播和网络通信的融合,交互TV(iTV)为超链接视频的常见的应用领域,。例如,欧洲GMF4iTV(交互式电视的一般媒体框架)项目已经开发了这样一个系统,其中活动的视频对象与元数据信息相关联,在生产时嵌入到程序流中,可以由用户在运行时选择以触发其相关元数据的显示。另一个欧洲PorTiVity (便携的交互式)项目使用完全端到端平台来开发和实验,为便携式设备和移动设备提供多媒体(Rich Media)交互电视服务,实现与连接至DVB-H (广播信道)和UMTS (单播信道)的手持接收器上的移动对象制剂和交互。IPTVanternet协议电视)为一个系统,其中数据电视服务使用覆盖网络基础设施的hternet协议来提供的,它还可能包括通过带宽连接提供的服务。基于IP的平台还提供重要的机会,允许使电视观看体验更加交互式和人性化。交互式TV服务将成为新兴的大量IPTV产品的重要区分因素。通过快速的双向连接的交互将使IPTV在当今电视中处于领先地位。本专利技术的各方面都与多媒体交互电视应用程序(例如IPTV应用程序)相关。专注点在于与运动程序中的移动对象交互。在与某些对象直接交互的基础上,电视观看者可以检索相关对象的链接多媒体内容。术语“电视”用于说明向用于显示的任何视频图像。例如,该图像可以显示在计算机屏幕、移动设备或真实的电视中并且始终处于电视的范围。运动员和裁判员为运动视频中的移动对象的两个示例。在IPTV系统中定位和标记它们对于IPTV系统中的交互服务非常有用,以便常规TV广播(MPEG-2/-4)可以藉由额外信息(已解码的MPEG-7,用于在视频中定义这些对象)以及将要显示的额外的内容(当选择它们时)来增强其功能。具有额外内容(元数据)的对象的规范,可以通过创作工具予以实现,例如抽取截图和关键帧的功能、交互区域的规范以及跟踪特定区域以获取所有帧中的区域。本专利技术的实施例中,推荐使用IPTV系统中的足球比赛程序的基于运动员组分类的交互服务。图1概述了此IPTV交互服务系统100。此交互是基于由IPTV服务器侧准备的信息以及IPTV客户端侧和/或网络中间盒中的实时组分类(例如图1中显示的内容和元数据源块105)。服务器侧的信息存储为 MPEG-7格式或者其他标准兼容(或专有)格式的元数据。该信息描述了运动场,组多直方图模式和有关组的相关的媒体信息。网络中间盒(network middle box)或者客户端侧的功能性单元,执行基于在线运动员/裁判员特征抽取以及MPEG-7元数据来的实时组分类, 在电视屏幕上显示相关媒体信息以进行用于用户交互。此系统可用于多个运动中。例如,诸如美式足球、足球、篮球、棒球、曲本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:黄浴李红兵田军虹·希瑟·郁
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术