基于深度学习的视频录摄方法、装置及终端制造方法及图纸

技术编号:19126479 阅读:87 留言:0更新日期:2018-10-10 07:53
本发明专利技术涉及一种基于深度学习的视频录摄方法,包括采集多个目标场景的多张训练样本图像;对每张训练样本图像进行预处理;利用预处理后的训练样本图像训练稀疏自编码网络;通过所述多张训练样本图像和所述稀疏自编码网络训练训练分类器,以得到分类模型;利用所述分类模型对视频录摄过程中的图像进行实时分类,以确定所述视频录摄的场景,从而调用与所述视频录摄的场景对应的音频参数。本发明专利技术还提供一种基于深度学习的视频录摄装置及终端。本发明专利技术的基于深度学习的视频录摄方法、装置及终端能利用训练后的稀疏自编码网络后训练训练分类器,从而对视频录摄的场景进行识别后调用与所述视频录摄的场景对应的音频参数,以提升视频摄录效果。

【技术实现步骤摘要】
基于深度学习的视频录摄方法、装置及终端
本专利技术涉及图像处理
,特别是涉及一种基于深度学习的视频录摄方法、装置及终端。
技术介绍
随着智能终端的快速发展,人们对智能终端的要求也越来越高,而摄像性能和效果又是其中重要的一环。现有的视频录摄方法在大声压环境,例如演唱会或大型晚会场景下,由于场面复杂,声音嘈杂,因此,如果麦克风输入的音频参数设置不合理就很容易导致麦克风输入溢出,从而容易导致音频信号截止,视频摄录效果很差。
技术实现思路
本专利技术的目的在于,克服现有的显示所存在的缺陷,而提供一种基于深度学习的视频录摄方法、装置及终端,其可以根据不同场景来调整音频参数,视频摄录效果好。一种基于深度学习的视频录摄方法,包括采集多个目标场景的多张训练样本图像;对每张训练样本图像进行预处理;利用预处理后的训练样本图像训练稀疏自编码网络;通过所述多张训练样本图像和所述稀疏自编码网络训练训练分类器,以得到分类模型;利用所述分类模型对视频录摄过程中的图像进行实时分类,以确定所述视频录摄的场景,从而调用与所述视频录摄的场景对应的音频参数。本专利技术还提供一种基于深度学习的视频录摄装置,所述装置包括图像采集模块、训练预处理模块、网络训练模块、分类模型获取模块、音频调整模块。图像采集模块用于采集多个目标场景的多张训练样本图像;训练预处理模块用于对每张训练样本图像进行预处理;网络训练模块用于利用预处理后的训练样本图像训练稀疏自编码网络;分类模型获取模块通过所述多张训练样本图像和所述稀疏自编码网络训练训练分类器,以得到分类模型;音频调整模块用于利用所述分类模型对视频录摄过程中的图像进行实时分类,以确定所述视频录摄的场景,从而调用与所述视频录摄的场景对应的音频参数。本专利技术还提供一种使用上述基于深度学习的视频录摄装置的终端。本专利技术的基于深度学习的视频录摄方法、装置及终端能利用训练后的稀疏自编码网络后训练训练分类器,从而对视频录摄的场景进行识别后调用与所述视频录摄的场景对应的音频参数,以提升视频摄录效果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。附图说明图1为一种终端的结构示意图。图2为本专利技术一实施例提供的基于深度学习的视频录摄方法的流程示意图。图3为本专利技术一实施例提供的基于深度学习的视频录摄装置的结构示意图。图4为本专利技术一实施例提供的终端的结构示意图。具体实施方式为更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的基于深度学习的视频录摄方法、装置及终端其具体实施方式、方法、步骤、结构、特征及其功效,详细说明如下。有关本专利技术的前述及其他
技术实现思路
、特点及功效,在以下配合参考图式的较佳实施例的详细说明中将可清楚呈现。通过具体实施方式的说明,当可对本专利技术为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图式仅是提供参考与说明之用,并非用来对本专利技术加以限制。图1示出了一种终端的结构框图。本专利技术的基于深度学习的视频录摄方法可以但不限于应用于如图1所示的终端。如图1所示,终端10包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、定位模块112、摄像模块114、音频模块116、屏幕118以及按键模块120。这些组件通过一条或多条通讯总线/信号线122相互通讯。可以理解,图1所示的结构仅为示意,终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。存储器102可用于存储软件程序以及模块,如本专利技术实施例中的基于深度学习的视频录摄方法及装置对应的程序指令/模块,处理器106通过运行存储在存储控制器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的基于深度学习的视频录摄方法及系统。存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器102可进一步包括相对于处理器106远程设置的存储器,这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。外设接口108将各种输入/输入装置耦合至CPU以及存储器102。处理器106运行存储器102内的各种软件、指令以执行终端10的各种功能以及进行数据处理。在一些实施例中,外设接口108,处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。射频模块110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。射频模块110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(GlobalSystemforMobileCommunication,GSM)、增强型移动通信技术(EnhancedDataGSMEnvironment,EDGE),宽带码分多址技术(widebandcodedivisionmultipleaccess,W-CDMA),码分多址技术(Codedivisionaccess,CDMA)、时分多址技术(timedivisionmultipleaccess,TDMA),蓝牙,无线保真技术(Wireless,Fidelity,WiFi)(如美国电气和电子工程师协会标准IEEE802.11a,IEEE802.11b,IEEE802.11g和/或IEEE802.11n)、网络电话(Voiceoverinternetprotocal,VoIP)、全球微波互联接入(WorldwideInteroperabilityforMicrowaveAccess,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。定位模块112用于获取终端10的当前位置。定位模块112的实例包括但不限于全球卫星定位系统(GPS)、基于无线局域网或者移动通信网的定位技术。摄像模块114用于拍摄照片或者视频。拍摄的照片或者视频可以存储至存储器102内,并可通过射频模块110发送。音频模块116向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。音频电路从外设接口108处接收声音数据,将声音数据转换为电信息,将电信息传输至扬声器。扬声器将电信息转换为人耳能听到的声波。音频电路还从麦克风处接收电信息,将电信号转换为声音数据,并将声音数据传输至外设接本文档来自技高网
...
基于深度学习的视频录摄方法、装置及终端

【技术保护点】
1.一种基于深度学习的视频录摄方法,其特征在于,包括:采集多个目标场景的多张训练样本图像;对每张训练样本图像进行预处理;利用预处理后的训练样本图像训练稀疏自编码网络;通过所述多张训练样本图像和所述稀疏自编码网络训练训练分类器,以得到分类模型;利用所述分类模型对视频录摄过程中的图像进行实时分类,以确定所述视频录摄的场景,从而调用与所述视频录摄的场景对应的音频参数。

【技术特征摘要】
1.一种基于深度学习的视频录摄方法,其特征在于,包括:采集多个目标场景的多张训练样本图像;对每张训练样本图像进行预处理;利用预处理后的训练样本图像训练稀疏自编码网络;通过所述多张训练样本图像和所述稀疏自编码网络训练训练分类器,以得到分类模型;利用所述分类模型对视频录摄过程中的图像进行实时分类,以确定所述视频录摄的场景,从而调用与所述视频录摄的场景对应的音频参数。2.如权利要求1所述的基于深度学习的视频录摄方法,其特征在于,对每张训练样本图像进行预处理的步骤包括:随机选取每张训练样本图像中的多个图像块;对所述训练样本图像的多个图像块进行白化处理。3.如权利要求1或2所述的基于深度学习的视频录摄方法,其特征在于,通过所述多张训练样本图像和所述稀疏自编码网络训练训练分类器,以得到分类模型的步骤包括:将所述训练样本图像中白化处理后的图像块作为稀疏自编码网络的输入矩阵和目标矩阵;采用正态分布随机初始化所述稀疏自编码网络的权值和偏置单元;采用BP反向传播算法更新所述稀疏自编码网络的权值和偏置单元。4.如权利要求2所述的基于深度学习的视频录摄方法,其特征在于,所述基于深度学习的视频录摄方法还包括:采集测试样本图像;随机选取每张测试样本图像中的多个图像块;对每张测试样本图像中的多个图像块进行白化处理;利用测试样本图像中白处理后的图像块对所述训练分类器进行分类效果测试;根据分类效果测试的结果调整音频参数。5.一种基于深度学习的视频录摄装置,其特征在于,所述装置包括:图像采集模块,用于采集多个目标场景的多...

【专利技术属性】
技术研发人员:邹超洋贺永刚万美君
申请(专利权)人:南昌黑鲨科技有限公司
类型:发明
国别省市:江西,36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1