The embodiment of this application discloses an audio processing method for video and related products. The method comprises the following steps: acquiring the first video captured, extracting the image frame data and audio frame data in the first video; acquiring the audio time interval of the audio frame data, extracting the first set of image frame data corresponding to the audio time interval from the image frame data; and for the first group. The image frame data is analyzed to determine the sound source location of the audio. According to the sound source location, the audio frame data are processed in 3D to get the processed audio frame data. The technical scheme provided in this application has the advantage of high user experience.
【技术实现步骤摘要】
视频的音效处理方法及相关产品
本申请涉及音频
,具体涉及一种视频的音效处理方法及相关产品。
技术介绍
随着电子设备(如手机、平板电脑等)的大量普及应用,电子设备能够支持的应用越来越多,功能越来越强大,电子设备向着多样化、个性化的方向发展,成为用户生活中不可缺少的电子用品,视频类应用为电子设备的高频应用,现有的视频拍摄对音频的位置并没有反应,即对于声源在左、右等位置并没有反应,这样导致视频的场景还原效果差,影响用户体验度。
技术实现思路
本申请实施例提供了一种视频的音效处理方法及相关产品,能够声源的位置对视频的音频进行处理,提升用户体验。第一方面,本申请实施例提供一种视频的音效处理方法,所述方法包括如下步骤:获取拍摄的第一视频,提取第一视频中的图像帧数据以及音频帧数据;获取音频帧数据的音频时间区间,从图像帧数据中提取与该音频时间区间对应的第一组图像帧数据;对第一组图像帧数据进行分析确定音频的声源位置,依据该声源位置对该音频帧数据进行3D音效处理得到处理后的音频帧数据。第二方面,提供一种电影音效处理装置,所述电影音效处理装置包括:获取单元,用于获取拍摄的第一视频,提 ...
【技术保护点】
1.一种视频的音效处理方法,其特征在于,所述方法包括如下步骤:获取拍摄的第一视频,提取第一视频中的图像帧数据以及音频帧数据;获取音频帧数据的音频时间区间,从图像帧数据中提取与该音频时间区间对应的第一组图像帧数据;对第一组图像帧数据进行分析确定音频的声源位置,依据该声源位置对该音频帧数据进行3D音效处理得到处理后的音频帧数据。
【技术特征摘要】
1.一种视频的音效处理方法,其特征在于,所述方法包括如下步骤:获取拍摄的第一视频,提取第一视频中的图像帧数据以及音频帧数据;获取音频帧数据的音频时间区间,从图像帧数据中提取与该音频时间区间对应的第一组图像帧数据;对第一组图像帧数据进行分析确定音频的声源位置,依据该声源位置对该音频帧数据进行3D音效处理得到处理后的音频帧数据。2.根据权利要求1所述的方法,其特征在于,所述依据该声源位置对该音频帧数据进行3D音效处理得到处理后的音频帧数据具体包括:如该声源位置位于左侧,则提高音频帧数据中左声道的音量或降低音频帧数据中右声道的音量;如该声源位置位于右侧,则提高音频帧数据中右声道的音量或降低音频帧数据中左声道的音量。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:第一视频为室内,对所述音频帧数据执行室内3D音效策略播放。4.根据权利要求3所述的方法,其特征在于,所述确定所述第一视频为室内的方法具体包括:从图像帧数据中随机抽取n帧图像数据,将n帧图像数据传输至训练好的分类器中执行分类算法处理确定n帧图像数据对应的n个场景,如n个场景均为室内,确定第一视频为室内,否则,确定第一视频为非室内;所述n为大于等于2的整数。5.根据权利要求1所述的方法,其特征在于,所述对第一组图像帧数据进行分析确定音频的声源位置具体包括:提取第一组图像帧数据连续时间段的m个图像帧,对m个图像帧进行人脸识别处理得到包含人脸的w个图像帧,提取w个图像帧中时间连续的x个图像帧,对x个图像帧的嘴巴区域识别确定x个图像帧具有嘴巴的动作时,确定x个图像帧中嘴巴区域的在x个图像中的位置为该音频的声源位置,所述m≥w≥x,所述m、w、x均为大于等于2...
【专利技术属性】
技术研发人员:朱克智,严锋贵,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。