数据处理装置、数据处理方法以及记录介质制造方法及图纸

技术编号:22946359 阅读:25 留言:0更新日期:2019-12-27 17:30
本发明专利技术提供数据处理装置、数据处理方法以及记录介质。能使图像数据内的被摄体(音源)与该被摄体所产生的声响的对应关系明确。若取得带声响数据图像数据(图4的步骤A1),就通过解析该取得的声响数据以及图像数据来确定存在于该图像数据内的音源即被摄体(图4的步骤A2~A5)。然后从取得的一系列声响数据中拣选与确定为音源的被摄体相符的声响数据并使该声响数据与该被摄体相互建立对应(图4的步骤A10)。在该情况下,例如与音源即被摄体的显示建立对应(与图像显示同步)地输出声响数据。

【技术实现步骤摘要】
数据处理装置、数据处理方法以及记录介质对相关申请的交叉参考本申请基于并主张美国法典第35条119款下的日本专利申请第2018116973号(2018年6月20日申请)的优先权,其完整公开包括具体实施方式、权利要求、附图和摘要通过引用结合于本文中。
本专利技术涉及取得并处理图像数据以及声响数据的数据处理装置、数据处理方法以及记录介质。
技术介绍
在取得图像数据以及声响数据并进行处理的数据处理装置(例如视频摄像机、紧凑型摄像机、智能手机等)中,作为将取得的图像数据和声响数据建立对应来重放的技术的一例,例如如特开2015-19162号公报那样,已知:若使用能进行视角大致180°的大范围的拍摄的广角镜头(鱼眼镜头)拍摄圆形图像(鱼眼图像),让会议中的各参加者的脸包含其中,则可从该拍摄的鱼眼图像中认识各参加者的脸,并和各个参加者的说话时间一起,将各参加者的图像(部分图像)裁出来进行显示。但在上述的专利文献的技术中,与显示中的裁出图像内的被摄体(参加者)的位置没有关系,仅是输出该拍摄时集音的声音数据,裁出图像内的被摄体(参加者)与该本文档来自技高网...

【技术保护点】
1.一种数据处理装置,其特征在于,具备:/n取得图像数据的图像取得单元;/n取得声响数据的声响取得单元;/n通过解析由所述图像取得单元取得的图像数据来确定存在于该图像数据内的音源即被摄体的确定单元;和/n从由所述声响取得单元取得的声响数据中提取与由所述确定单元确定为音源的被摄体相符的特定声响数据并控制成使所述特定声响数据和该被摄体相互建立对应的对应建立单元。/n

【技术特征摘要】
20180620 JP 2018-1169731.一种数据处理装置,其特征在于,具备:
取得图像数据的图像取得单元;
取得声响数据的声响取得单元;
通过解析由所述图像取得单元取得的图像数据来确定存在于该图像数据内的音源即被摄体的确定单元;和
从由所述声响取得单元取得的声响数据中提取与由所述确定单元确定为音源的被摄体相符的特定声响数据并控制成使所述特定声响数据和该被摄体相互建立对应的对应建立单元。


2.根据权利要求1所述的数据处理装置,其特征在于,
所述数据处理装置还具备:
通过解析由所述声响取得单元取得的声响数据来得到声响性特征的声响解析单元,
所述确定单元通过基于由所述声响解析单元得到的声响性特征解析由所述图像取得单元取得的图像数据,来确定存在于该图像数据内并作为具有该声响性特征的音源的被摄体。


3.根据权利要求1所述的数据处理装置,其特征在于,
所述确定单元通过解析由所述图像取得单元取得的图像数据内的被摄体来确定音源即被摄体,
所述对应建立单元通过基于由所述确定单元确定为音源的被摄体的外观性特征解析由所述声响取得单元取得的声响数据来提取与具有该外观性特征的被摄体相符的所述特定声响数据,并控制成使所述特定声响数据和该被摄体相互建立对应。


4.根据权利要求1所述的数据处理装置,其特征在于,
所述确定单元通过解析由所述图像取得单元取得的图像数据内的被摄体的动作来确定音源即被摄体。


5.根据权利要求1~4中任一项所述的数据处理装置,其特征在于,
所述数据处理装置还设有显示所述图像数据的显示单元,
所述对应建立单元使所述显示单元显示包含被确定为所述音源的被摄体的图像数据,并控制成使所述提取的特定声响数据和该显示中的所述被摄体相互建立对应。


6.根据权利要求5所述的数据处理装置,其特征在于,
所述数据处理装置还具备:
从由所述图像取得单元取得的图像数据中裁出包含由所述确定单元确定为音源的被摄体的区域的裁出单元,
所述对应建立单元使所述显示单元显示由所述裁出单元裁出的裁出图像,并且从由所述声响取得单元取得的声响数据中提取与所述裁出图像内作为音源而包含的被摄体相符的所述特定声响数据,并控制成使所述特定声响数据和该显示中的所述被摄体相互建立对应。


7.根据权利要求5所述的数据处理装置,其特征在于,
所述数据处理装置还具备:
从显示于所述显示单元的图像数据中裁出包含任意指定的被摄体作为音源的区域的裁出单元,
所述对应建立单元使所述显示单元显示由所述裁出单元裁出的裁出图像,并且从由所述声响取得单元取得的声响数据中提取与所述裁出图像内作为音源而包含的被摄体相符的特定声响数据,并控制成使所述特定声响数据和该被摄体相互建立对应。


8.根据权利要求1所述的数据处...

【专利技术属性】
技术研发人员:石毛善树
申请(专利权)人:卡西欧计算机株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1