数据处理装置及数据处理方法制造方法及图纸

技术编号:22726365 阅读:15 留言:0更新日期:2019-12-04 07:19
本发明专利技术的目的在于实现一种数据处理装置,其使用声音数据对内容的场景进行判定,根据该场景的判定结果,选择针对声音数据执行的处理。本发明专利技术所涉及的数据处理装置包含:第1判定部,其使用声音数据,输出与内容的场景相关的第1判定结果;处理选择部,其与所述第1判定结果相应地,通过第1选择方法选择针对所述声音数据的处理;声音数据处理部,其针对所述声音数据而执行由所述处理选择部选择出的所述处理;以及第2判定部,其从多个属性候选中,对所述内容的属性进行判定,所述处理选择部与所述属性的判定结果相应地,通过与所述第1选择方法不同的第2选择方法对所述处理进行选择。

Data processing device and data processing method

The object of the invention is to realize a data processing device, which uses sound data to determine the scene of content, and selects the processing performed for the sound data according to the result of the determination of the scene. The data processing device of the present invention includes: the first determination unit, which uses the sound data to output the first determination result related to the scene of the content; the processing selection unit, which selects the processing for the sound data through the first selection method corresponding to the first determination result; the sound data processing unit, whose execution for the sound data is selected by the processing selection unit The selected processing and the second determination unit determine the attribute of the content from a plurality of attribute candidates. The processing selection unit and the determination result of the attribute correspondingly select the processing by a second selection method different from the first selection method.

【技术实现步骤摘要】
数据处理装置及数据处理方法
本专利技术涉及数据处理装置及数据处理方法。
技术介绍
下述,在专利文献1中公开了一种影像声音信号处理装置,其根据由影像解码器解码出的图像数据,对影像场景的特征进行判定,与该影像场景的特征相应地生成声场控制信息。专利文献1:日本特开2009-296274号公报在上述专利文献1的结构中,不使用声音数据,而是使用图像数据对内容的场景进行判定,与该场景的判定结果相应地生成声场控制信息,因此存在下述课题,即,该声场控制不一定是适当的。
技术实现思路
在本专利技术中,目的在于实现一种数据处理装置,其使用声音数据对内容的场景进行判定,根据该场景的判定结果,选择对声音数据执行的处理。本专利技术所涉及的数据处理装置,其包含:第1判定部,其使用声音数据,输出与内容的场景相关的第1判定结果;处理选择部,其与所述第1判定结果相应地,通过第1选择方法选择针对所述声音数据的处理;声音数据处理部,其针对所述声音数据而执行由所述处理选择部选择出的所述处理;以及第2判定部,其从多个属性候选中,对所述内容的属性进行判定,所述处理选择部与所述属性的判定结果相应地,通过与所述第1选择方法不同的第2选择方法对所述处理进行选择。本专利技术所涉及的数据处理方法,使用声音数据,输出与内容的场景相关的第1判定结果,与所述第1判定结果相应地,通过第1选择方法选择针对所述声音数据的处理,针对所述声音数据而执行选择出的所述处理,从多个属性候选中,对所述内容的属性进行判定,与所述属性的判定结果相应地,通过与所述第1选择方法不同的第2选择方法对所述处理进行选择。附图说明图1是表示第1实施方式中的控制部及声音数据处理部的功能性结构的框图。图2是包含第1实施方式中的数据处理装置的听取环境的示意图。图3是表示第1实施方式中的数据处理装置的结构的示意性的框图。图4是第1实施方式中的数据处理方法的流程图。图5是在第1实施方式中使用的场景判定模型的概念图。标号的说明1数据处理装置,11输入部,12解码器,13声道扩展部,14声音数据处理部,15D/A转换器,16放大器,17控制部,18ROM,19RAM,31第1判定部,32处理选择部,33第2判定部,21L前-左扬声器,21R前-右扬声器,21C中央扬声器,21SL环绕-左扬声器,21SR环绕-右扬声器。具体实施方式[第1实施方式]以下,使用附图对本专利技术的第1实施方式进行说明。本实施方式中的数据处理装置1包含控制部17和声音数据处理部14。控制部17包含第1判定部31、处理选择部32及第2判定部33。第1判定部31使用声音数据,输出与内容的场景相关的第1判定结果。第2判定部33从多个属性候选中对内容的属性进行判定。处理选择部32基本来说,与第1判定结果相应地,通过第1选择方法对处理(例如,声场)进行选择。但是,处理选择部32与通过第2判定部33得到的属性的判定结果相应地,通过与第1选择方法不同的第2选择方法对所述处理进行选择。声音数据处理部14针对声音数据而执行由处理选择部32选择出的处理。例如,声音数据处理部14将由处理选择部32选择出的声场的效果赋予给所述声音数据。通过如上所述的结构,本专利技术的数据处理装置1能够使用声音数据对内容的场景进行判定,根据该场景的判定结果,进行针对声音数据的处理(例如,声场控制)。因此,能够进行更适当的处理。作为例子,关于内容是包含描述车辆的行驶场景的影像数据的音乐视频的情况进行说明。在使用影像数据对内容的场景进行判定的情况下,由于在影像数据中包含有车辆的行驶场景,因此有可能进行对与车辆的行驶声音相关的频率进行强调的声场控制。但是,在本实施方式的结构中,即使在影像数据中包含有车辆的行驶场景,数据处理装置1仍会使用音乐视频所包含的声音数据而进行场景的判定。因此,能够进行更适当的声场控制。另外,通过设为处理选择部32与由第2判定部33得到的属性的判定结果相应地,通过与第1选择方法不同的第2选择方法对所述声场进行选择的结构,由此能够设为可进行与多个属性相对应的声场控制。下面,对更具体的结构进行说明。图2是包含本实施方式中的数据处理装置1的听取环境的示意图。如图1所示,在本实施方式中,在听取位置U的周围设置有前-左扬声器21L、前-右扬声器21R、中央扬声器21C、环绕-左扬声器21SL、及环绕-右扬声器21SR。前-左扬声器21L设置于听取位置U的前方左侧,前-右扬声器21R设置于听取位置U的前方右侧,中央扬声器21C设置于听取位置U的前方中央,环绕-左扬声器21SL设置于听取位置U的后方左侧,环绕-右扬声器21SR设置于听取位置U的后方右侧。前-左扬声器21L、前-右扬声器21R、中央扬声器21C、环绕-左扬声器21SL、及环绕-右扬声器21SR各自通过无线或有线而与数据处理装置1连接。此外,在本实施方式中,举出5ch的环绕系统的例子进行说明,但本专利技术除此以外也能够在2.0ch、5.1ch、7.1ch、11.2ch等各种声道数的环绕系统中使用。图3是表示本实施方式中的数据处理装置1的结构的示意性的框图。数据处理装置1能够使用例如AV放大器、个人计算机、电视接收机所包含的声音处理部、一体式的扬声器等而实现。如图3所示,本实施方式中的数据处理装置1具有:输入部11、解码器12、声道扩展部13、声音数据处理部14、D/A转换器15、放大器(amplifier)16、控制部17、ROM(read-onlymemory)18及RAM(Randomaccessmemory)19。控制部17将在ROM18中存储的动作用程序(固件)读出至RAM19,对数据处理装置1集中地进行控制。该动作用程序可以与光学、磁性等的种类无关地从各种记录介质进行安装,也可以经由互联网下载。输入部11经由HDMI(注册商标)、网络而取得音频信号。作为音频信号的方式,例如包含PCM(pulsecodemodulation)、Dolby(注册商标)、DolbyTrueHD、DolbyDigitalPlus、DOLBYATMOS(注册商标)、AAC(AdvancedAudioCoding)(注册商标)、DTS(注册商标)、DTS-HD(注册商标)MasterAudio、DTS:X(注册商标)、DSD(DirectStreamDigital)(注册商标)等,其种类并不特别受到限定。输入部11将声音数据输出至解码器12。在本实施方式中,网络包含无线LAN(LocalAreaNetwork)、有线LAN、WAN(WideAreaNetwork)等,作为数据处理装置1和光盘播放器等声源装置之间的信号传递路径起作用。解码器12例如由DSP(DigitalSignalProcessor)构成,对音频信号进行解码,提取声音数据。此外,在本实施方式中,声音数据只要没有特别记载,则全部作为数字数据而进行说明。声道扩展部13例如由D本文档来自技高网...

【技术保护点】
1.一种数据处理装置,其包含:/n第1判定部,其使用声音数据,输出与内容的场景相关的第1判定结果;/n处理选择部,其与所述第1判定结果相应地,通过第1选择方法选择针对所述声音数据的处理;/n声音数据处理部,其针对所述声音数据而执行由所述处理选择部选择出的所述处理;以及/n第2判定部,其从多个属性候选中,对所述内容的属性进行判定,/n所述处理选择部与所述属性的判定结果相应地,通过与所述第1选择方法不同的第2选择方法对所述处理进行选择。/n

【技术特征摘要】
20180525 JP 2018-1004291.一种数据处理装置,其包含:
第1判定部,其使用声音数据,输出与内容的场景相关的第1判定结果;
处理选择部,其与所述第1判定结果相应地,通过第1选择方法选择针对所述声音数据的处理;
声音数据处理部,其针对所述声音数据而执行由所述处理选择部选择出的所述处理;以及
第2判定部,其从多个属性候选中,对所述内容的属性进行判定,
所述处理选择部与所述属性的判定结果相应地,通过与所述第1选择方法不同的第2选择方法对所述处理进行选择。


2.根据权利要求1所述的数据处理装置,其中,
所述第1判定部基于通过仅与所述多个属性候选中的一部分的属性候选相关的机械学习而生成的场景判定模型,输出所述第1判定结果。


3.根据权利要求2所述的数据处理装置,其中,
所述处理选择部,
在所述内容的属性包含于所述一部分的属性候选的情况下,采用所述第1选择方法,
在所述内容的属性不包含于所述一部分的属性候选的情况下,采用所述第2选择方法。


4.根据权利要求2或3所述的数据处理装置,其中,
所述第1判定部从所述声音数据进行特征提取,基于所述场景判定模型而进行分类,由此作为所述第1判定结果,输出与多个场景候选相关的得分。


5.根据权利要求4所述的数据处理装置,其中,
所述处理选择部,在所述第2选择方法中,在除了规定的场景候选以外的所述多个场景候选中,选择与具有最高的得分的所述场景候选相对应的所述处理。


6.根据权利要求4所述的数据处理装置,其中,
所述处理选择部,在所述第2选择方法中,与所述属性的判定结果相应地对与所述多个场景候选相关的所述得分乘以系数。


7.根据权利要求1至4中任一项所述的数据处理装置,其中,
所述处理选择部,在所述第2选择方法中,与所述属性的判定结果相应地对规定的处理进行选择。


8.根据权利要求1至7中任一项所述的数据处理装置,其中,
所...

【专利技术属性】
技术研发人员:汤山雄太熊谷邦洋青木良太郎
申请(专利权)人:雅马哈株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1