当前位置: 首页 > 专利查询>诺基亚公司专利>正文

音频控制图像捕捉制造技术

技术编号:8026851 阅读:185 留言:0更新日期:2012-11-29 12:31
一种方法,包括:接收对应于覆盖用于释放快门的时刻的时间段的多个图像;使用音频捕捉装置来接收与多个图像相关联的音频信号;分析接收到的音频信号以便确定与期望的输出图像相关联的音频事件;以及基于接收到的音频信号的分析来选择多个图像中的至少一个以进行进一步处理以便获得期望的输出图像。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及成像,并且更具体地涉及根据音频信息来控制静止图像捕捉。
技术介绍
在图像捕捉技术的领域中,连同保证最好的可能图像质量的目标一起,已经为许多照相机提供了所谓的连拍功能。在连拍功能中,当用户已释放了快门时,图像捕捉设备被布置为拍摄多个图像以便捕捉合适的时刻。用户然后可以稍后选择多个图像中的最好的一个或多个。在更先进的解决方案中,用户或图像捕捉设备可以将多个图像或所有捕捉图像组合成具有增强视觉质量的一个合成输出图像。在连拍功能的另一实施例中,已知的是用不同的曝光时间拍摄多个图像并选择期 望的一个或多个作为输出图像,或者用于进一步处理以导出具有增强视觉质量的合成输出图像。然而,仍存在某些缺点。捕捉图片有时可能要求快速反应以便抓住用户想要捕捉的图片。尤其是在图片的对象正在移动的情况下,图片的时间选择可能很容易是非最佳的,对象可能已经避开图像且错过了期望的时刻。此外,在已知的连拍解决方案中,选择最好质量图像或合成增强的输出图像始终要求捕捉图像的后处理,用户可能经历麻烦和耗时。
技术实现思路
现在已经专利技术了一种改进的方法和实现该方法的技术设备,由此帮助图像捕捉设备的用户以改善的质量拍摄图片。本专利技术的各种方面包括方法、设备和计算机程序,其特征在于在独立权利要求中所述的内容。在从属权利要求中公开了本专利技术的各种实施例。根据第一方面,根据本专利技术的方法是基于这样的思想,即接收对应于覆盖预定时刻的时间段的多个图像;使用音频捕捉装置来接收与所述多个图像相关联的音频信号;分析接收到的音频信号以便确定与期望的输出图像相关联的音频事件;以及基于接收到的音频信号的分析来选择所述多个图像中的至少一个以进行进一步处理,以便获得期望的输出图像。根据实施例,该方法还包括接收所述多个图像,包括响应于图像捕捉设备的用户发出在预定时刻释放快门的命令使用图像捕捉单元在覆盖预定时刻的时段期间捕捉多个图像;以及接收音频信号包括使用音频捕捉装置来捕捉与所述多个图像相关联的音频信号。根据实施例,该方法还包括接收对应于所述预定时刻之前的第一时刻的多个图像。根据实施例,该方法还包括接收对应于所述预定时刻之后的第二时刻的多个图像。根据实施例,所述音频接收装置包括一个或多个扩音器。根据实施例,所述音频接收装置包括由两个或更多扩音器组成的扩音器阵列。根据实施例,该方法还包括估计音频信号的到达方向,以便确定产生音频信号的对象在图像的期望部分中的时间。根据实施例,使用基本上垂直于扩音器阵列地存在的、产生音频信号的对象来确定对象在图像的期望部分中的时间。根据实施例,该方法还包括估计接收音频信号的能量以便确定所述多个图像内的感兴趣事件。根据实施例,使用接收音频信号的能量的急剧变化来确定感兴趣事件的期望时刻。根据实施例,该方法还包括估计接收音频信号的基频,以便从所述多个图像确定其中产生音频信号的对象最接近于提供所述多个图像的图像捕捉设备的至少一个图像。 根据实施例,该方法还包括使用基频的估计来选择其中产生音频信号的对象正在接近提供所述多个图像的图像捕捉设备的图像。根据实施例,该方法还包括获得关于提供所述多个图像的图像捕捉设备与产生音频信号的对象之间的距离的信息;以及用所述距离上的由声速引起的延迟来调整音频信号的捕捉。根据本专利技术的布置提供显著的优点。在一般水平上,其通过分析与多个图像相关联的音频信号以便基于所述多个图像确定最佳输出图像来使得图像捕捉设备的用户能够或帮助其以改善的质量拍摄图片。更特别地,用户可以通过从图像组自动地选择例如其中感兴趣的对象存在于取景器的中间或发生特殊音频事件(例如碰撞或爆炸)或对象正在接近照相机(前视图)的图像来捕捉质量更好的图像。在最接近于期望音频事件的时刻自动地选择输出图像。根据第二方面,提供了一种设备,包括图像接收单元,其用于接收对应于覆盖预定时刻的时间段的多个图像;音频接收单元,其用于使用音频捕捉装置来接收与所述多个图像相关联的音频信号;分析单元,其用于分析接收到的音频信号以便确定与期望的输出图像相关联的音频事件;以及选择单元,其用于基于接收到的音频信号的分析来选择所述多个图像中的至少一个以进行进一步处理以便获得期望的输出图像。基于以下进一步的实施例的详细公开,本专利技术及其相关实施例的这些及其它方面将变得显而易见。附图说明下面将参考附图来更详细地描述本专利技术的各种实施例,在所述附图中图I示出一系列连拍图像的示例;图2示出布置在图像捕捉设备中的多扩音器阵列的示例;图3示出根据本专利技术的实施例实现的功能单元的示例;图4示出波束成形器构造中的由多个扩音器组成的一般扩音器阵列;图5示出针对捕捉音频信号的声音到达方向估计的示例;图6示出针对捕捉音频信号的声音水平估计的示例;以及图7示出针对捕捉音频信号的基频估计的示例。具体实施例方式下面,将通过一般地参考图像捕捉设备、偶尔参考照相机设备作为众所周知的示例来举例说明本专利技术。然而,应注意的是本专利技术不仅仅限于独立的照相机,而是可以在包括图像传感器和用于处理捕捉图像和音频信息的装置的任何图像捕捉设备中实现之。例如,可以在装配有照相机模块的移动终端、PDA设备、便携式计算机或膝上型计算机中利用本专利技术。因此,还必须从此类设备从图像捕捉单元接收图像和/或从音频捕捉单元接收音频信息的角度考虑本专利技术,该设备随后如实施例中所述地处理接收到的图像和音频信息。下述实施例提供一种用于当图像捕捉设备在多拍操作模式下操作时控制图像捕捉设备的方法。在连拍操作模式下,例如照相机的图像捕捉设备被布置为每当快门被释放时拍摄多个图像。在连拍操作模式下拍摄的图像的数目可以是图像捕捉设备的默认设置,或者其可以是可由用户在设备设置中调整的,并且捕捉图像的数目可以在两个至几十个或者甚至几百个图像的范围内变化。以下实施例中所述的示例是基于在每个连拍系列中捕捉十个图像的设置。 在连拍操作模式下,图像捕捉设备一般被布置为在覆盖(即包括)用于释放快门的预定时刻的时段期间拍摄多个图像。优选地,拍摄一系列图像可以在快门按钮被断然按下之前就已经开始,例如当按钮被按下一半时就已经开始,这使得能够调整用于后续图像的焦点。可以将照相机布置为分别在按钮被断然地按下之前和之后存储预定数目的图像。例如,在十个图像的连拍系列中,可以将前五个图像布置为在按钮处于半途中之后但在其被完全按下之前捕捉,并且其余的五个图像是随后在按钮已被完全按下之后捕捉的。无论在连拍系列中拍摄的图像的数目如何,图像捕捉设备仍可以包括预定余量(margin)值,其控制操作,使得可以随后丢弃在快门被完全释放之前比预定余量更早地捕捉的图像,而不进行进一步处理或将其保存在存储器中。图I呈现了当用户已按下按钮时对对象(在这种情况下,即通过的赛车)所拍摄的一系列的前五个图片的示例。在图中未示出后五个图片。在举例说明下述实施例时利用图I的同一不例。根据实施例,当在连拍操作模式下操作且捕捉多个图像的连拍系列时,图像捕捉设备还被布置为捕捉与连拍系列中的图像相关联的音频信号。捕捉音频信号的时间段可以是图像捕捉设备的默认设置,或者其可以是可由用户在设备设置中调整的。音频捕捉优选地基本上在图像捕捉开始的同时开始。因此,优选地将图像捕捉设备布置为分别捕捉与在用户已完全按下按钮之前的一系列图像相关联的适当时间段(例如五本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:P·奥雅拉R·比尔卡
申请(专利权)人:诺基亚公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1