基于负空间识别向图像添加内容的方法和系统技术方案

技术编号:27439648 阅读:32 留言:0更新日期:2021-02-25 03:41
提供了用于向图像添加内容的实施例。接收多个图像。多个图像中的每个包括多个图像部分。为多个图像部分中的每个计算负空间得分。基于所述计算的负空间得分,选择所述多个图像部分中的至少一些图像部分以显示内容。使所述多个图像被渲染为在所述多个图像部分中的所述选择的至少一些图像部分上具有所述显示的内容。内容。内容。

【技术实现步骤摘要】
基于负空间识别向图像添加内容的方法和系统


[0001]本专利技术总体上涉及计算系统,并且更具体地,涉及用于基于负空间识别向图像添加内容的各种实施例。

技术介绍

[0002]各种类型的图像通常以显示图像本身中所显示内容以外的内容的方式呈现。例如,视频(例如电视广播、电影等)有时显示有“字幕”或“隐藏字幕”,其中包括与视频相关的声音的基于文本的版本(例如对话、音效描述、歌曲名称等)和/或其他内容(例如广告、标识等)。在某些情况下,这个内容会模糊观众希望观看的部分图像(例如观看体育赛事时与职业运动员或团队有关的统计信息)。
[0003]该问题的当前解决方案包括,例如,禁用内容的显示和/或定制显示内容的方式。但是,用于定制内容显示的当前方法没有提供适应特定场景(例如,图像中主题的类型、大小、位置等)的灵活、动态的解决方案,并且通常导致显示内容以相对固定的方式。结果,图像的“重要”或“期望”部分仍然经常被模糊。

技术实现思路

[0004]提供了用于通过处理器向图像添加内容的各种实施例。接收多个图像。所述多个图像中的每个包括多个图像部分。为所述多个图像部分中的每个计算负空间得分。基于所述计算的负空间得分,选择所述多个图像部分中的至少一些图像部分以显示内容。使所述多个图像被渲染为在所述多个图像部分中的所述选择的至少一些图像部分上具有显示的内容。
[0005]除了前述示例性实施例之外,还提供了各种其他系统和计算机程序产品实施例,并提供了相关的优点。提供了前述
技术实现思路
以简化形式介绍一些概念,这些概念将在下面的详细描述中进一步描述。本概述既不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。要求保护的主题不限于解决
技术介绍
中指出的任何或所有缺点的实施方式。
附图说明
[0006]为了容易理解本专利技术的优点,将通过参考附图中示出的特定实施例来对以上简要描述的本专利技术进行更具体的描述。理解这些附图仅示出了本专利技术的典型实施例,因此不应认为是对本专利技术范围的限制,将通过使用附图以附加的特征和细节来描述和解释本专利技术,其中:
[0007]图1示出根据本专利技术的实施例的示例性计算节点的框图;
[0008]图2示出根据本专利技术的实施例的示例性云计算环境的附加框图;
[0009]图3示出根据本专利技术的实施例的抽象模型层的附加框图;
[0010]图4示出根据本专利技术的实施例的用于向图像添加内容的方法和/或系统的框图;
[0011]图5是根据本专利技术实施例的示例性接收图像的平面图;
[0012]图6是将图5的图像分为多个部分的平面图;
[0013]图7是在选择部分上方显示内容的图6的图像的平面图;
[0014]图8是根据本专利技术实施例的在选择部分上方显示内容的示例性第二接收图像的平面图;
[0015]图9是根据本专利技术实施例的在中间位置显示内容的图8的图像的平面图;
[0016]图10是根据本专利技术实施例的示例性控制面板的平面图;以及
[0017]图11是根据本专利技术实施例的用于向图像添加内容的示例性方法的流程图。
具体实施方式
[0018]如上所述,经常以显示图像本身中所显示内容以外的内容的方式来渲染各种类型的图像。例如,有时会向视频(例如电视广播、电影等)显示“字幕”或“隐藏式字幕”,其中包括与视频相关的声音的基于文本的版本(例如对话、音效描述、歌名等)和/或其他内容(例如广告、标识等)。在某些情况下,此内容的显示方式会遮挡观众希望观看的部分图像。
[0019]例如,考虑观众正在观看(或收看、消费等)实况事件的电视广播的场景,所述实况事件例如是颁奖晚会或体育赛事。如果正在为广播提供隐藏式字幕(例如,作为用户启用的可选功能),通过向图像(或视频帧)添加隐藏式字幕,可以(至少部分地)模糊(或“遮挡”)作为广播的一部分显示的各种类型的信息,例如被提名人赢得的其他奖项或与特定运动员或团队有关的统计信息。
[0020]类似地,当观看者正在观看电影时,即使在图像边缘附近显示了这种“额外”内容(例如,字幕或广告),也可能模糊图像中被认为是“重要”的图像部分。例如,内容创建者可以有意地显示重要细节,以使其不在帧中居中。
[0021]该问题的当前解决方案包括例如禁用内容和/或定制显示内容的方式。但是,用于定制内容显示的当前方法没有提供适应特定场景(例如,图像中主题的类型、大小、位置等)的灵活,动态的解决方案,并且通常导致内容以相对固定的方式显示。结果,图像的重要或期望部分仍然经常被模糊。
[0022]为了解决现有技术中的这些需求和/或缺点,在本文描述的一些实施例中,公开了例如分析要渲染的图像(例如,镜头、视频等)的方法和/或系统,以及在渲染图像时,以优化用户观看体验的方式(例如,最小化图像的重要/期望部分被模糊的程度)显示内容(例如标题、广告等)。在一些实施例中,以动态方式自动执行该过程,使得不考虑正在被渲染的图像,观看均被优化。
[0023]在一些实施例中,通过相对于“负空间”分析接收到的(和/或“待渲染”)图像来执行该过程。如本领域技术人员将理解的,负空间可以被认为是围绕图像的主题(例如背景或其他部分)的相对“空”的空间(或图像的部分),主要主题不占据该空间(即图像的“不重要”部分)。例如,如果图像显示个体(例如,不管他们在图像中的位置如何),在其后方/周围有蓝天或图案墙纸,则可以考虑图像中显示天空或墙纸的部分是负空间。相反,即使对象不一定位于图像的中心(即,图像的“重要”部分),被对象(例如,个体)占据的图像部分可以被视为“正空间”。
[0024]例如,在一些实施例中,在被渲染之前(例如,在例如电视、计算设备显示屏等显示
器上显示),一系列图像(或至少一个图像)例如包括多个视频帧的视频(或视频剪辑)被接收(或检索、检测等)。系统将每个图像划分成较小的部分,然后对其进行处理(例如,通过视觉识别或计算机视觉软件和/或认知分析),以确定哪些部分是(或包括)负空间,哪些部分是正空间(例如,系统将每个部分分类为负空间或正空间)。例如,系统可以为每个部分计算负空间分数(或负空间置信度分数)。
[0025]系统然后(例如,基于所计算的分数)选择图像的一个或多个部分以显示“附加”内容(例如,标题、广告等)。然后,在适合的显示设备上渲染(或使得被渲染)图像,并且内容在图像的所选部分中(或上、上方等)被显示。结果可能是,内容以这样的方式显示在图像上/上方:其位置(和/或大小、形状等)不是静态的,而是随着图像被用户(或观看者)使用(进行观看)而灵活和动态的,并且最大化或优化用户的观看体验。
[0026]在一些实施例中,实现了附加特征以进一步增强用户的观看体验。例如,由于渲染的图像不同,上述基本方法可能导致渲染期间内容(例如标题)在图像(或显示屏)周围“跳跃”或“滑过(darting)”。即,当与视频一起使用时,在某些情况下(例如,当一个视频帧与下一个视频帧之间存在显著变化时),内容可能看本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种向图像添加内容的方法,包括:接收多个图像,其中所述多个图像中的每个包括多个图像部分;为所述多个图像部分中的每个计算负空间得分;基于所述计算出的负空间得分,选择所述多个图像部分中的至少一些图像部分以显示内容;以及使所述多个图像被渲染为在所述多个图像部分中的所述选择的至少一些图像部分上具有所述显示的内容。2.根据权利要求1所述的方法,其中所述多个图像包括多个视频帧。3.根据权利要求1所述的方法,其中使所述多个图像被渲染包括:使所述多个图像中的第一图像被渲染为在所述多个图像部分中的第一图像部分上具有所述显示的内容;以及在所述多个图像中的第一个图像被渲染之后,使得所述多个图像中的第二图像被渲染为在所述多个图像部分中的第二个图像部分上具有所述显示的内容。4.根据权利要求3所述的方法,还包括限制所述多个图像中的所述第一图像上的内容的位置与所述多个图像中的第二图像上的内容的位置之间的距离。5.根据权利要求1所述的方法,其中所述内容包括与所...

【专利技术属性】
技术研发人员:J纳什O奥赛格博沃S帕特尔C谢卡尔
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1