一种视频处理方法和终端技术

技术编号:37461353 阅读:5 留言:0更新日期:2023-05-06 09:34
一种视频处理方法和终端。在该方法中,终端在录制视频的过程中,终端可以通过摄像机拍摄(采集)图像(后文中该通过摄像机拍摄的图像称为原图像),基于该原图像确定拍摄的焦点。然后,终端可以对该焦点所在的第一图像区域中显示的被拍摄对象实现图像追焦,同时对该焦点所在的第二图像区域中显示的被拍摄对象实现音频追焦。通过图像追焦以及音频追焦得到追焦视频。频。频。

【技术实现步骤摘要】
一种视频处理方法和终端


[0001]本申请涉及终端及通信
,尤其涉及一种视频处理方法和终端。

技术介绍

[0002]随着终端的发展,终端的功能越来越多。例如,在录制视频时具有图像变焦和音频变焦 的功能。其中,图像变焦是指在终端录制视频的过程中可以通过改变变焦倍率而使得获取的 图像中的被拍摄对象的大小改变,具体可以表现在:即使被拍摄对象相对于终端的位置没有 改变,如果变焦倍率变大,在视频中,终端显示该被拍摄对象时,该被拍摄对象变大,会给 用户一种该被拍摄对象距离终端相对更近的感觉;如果变焦倍率变小,在视频中,终端显示 该拍摄对象时,该被拍摄对象变小,会给用户一种该被拍摄对象相对终端更远的感觉。音频 变焦是指在终端录制视频的过程中可以通过改变变焦倍率而使得获取的图像中的被拍摄对象 的声音大小改变,具体可以表现在:变焦倍率变大,在视频中,终端显示的被拍摄者变大时, 会给用户一种该被拍摄者相对终端更近的感觉,则此时,该终端显示的被拍摄者的声音也对 应性变大;变焦倍率变小,在视频中,终端显示的被拍摄者变小时,会给用户一种该被拍摄 者相对终端更远的感觉,则此时,该被拍摄者的声音也可以对应性变小。这样,图像和对应 的音频都可以实现变焦,可以带来音频和图像同时变焦的效果,增强用户感官体验。
[0003]但是,终端要实现音频和图像同时变焦需要调整变焦倍率,通常是用户通过操作变焦倍 率控件使得终端对变焦倍率进行调整。且在被拍摄对象相对于终端的位置改变的情况下,在 对被拍摄对象进行图像变焦和音频变焦时要实现较好的效果,得到高质量的视频,对用户的 拍摄技术要求较高。
[0004]所以,终端如何在录制视频时进一步提高视频质量以增强用户感官体验,是研究的方向。

技术实现思路

[0005]本申请提供了一种视频处理方法及终端,使得终端录制的视频中,可以实现音频和图像 同时追焦的效果。
[0006]第一方面,本申请提供了一种视频处理方法,应用于终端,所述终端包括摄像头,所述 方法包括:所述终端启动相机;显示预览界面,所述预览界面包括预览框和第一控件;在所 述预览框显示所述摄像头采集的第一图像,所述第一图像的第一区域包括第一对象;检测到 针对所述第一控件的第一操作;响应于所述第一操作,开始录制,显示录制界面,所述录制 界面包括所述预览框和第二控件;所述预览框显示第二图像,所述第二图像包括第一区域和 第二区域,所述第一区域包括第一拍摄对象;基于对所述第一区域的第三操作,确定第一区 域为焦点区域;显示第一窗口,所述第一窗口显示包括所述第一拍摄对象的第三图像;在第 一时刻,预览框显示第四图像,所述第一窗口显示第五图像和获取第一输入音频,所述第四 图像和所述第五图像都包括所述第一拍摄对象,所述第一输入音频包括所
述第四图像的第一 区域对应的声音以及所述第四图像的第二区域对应的声音;检测到对所述第二控件的第四操 作,响应于所述第四操作,停止录制,保存第一视频和第二视频,所述第一视频为对应所述 预览框的视频,所述第二视频为对应所述第一窗口的视频,其中,所述第二视频的所述第一 时刻处包括所述第五图像和第一音频,所述第一音频对所述第一输入音频进行处理后得到的 音频,所述第一音频包括对所述第四图像的所述第一区域对应的声音进行增强处理的声音以 及所述第四图像的所述第二区域进行抑制处理后的声音。
[0007]上述实施例中,如果确定了焦点区域,在录制视频的过程中,终端可以通过摄像机采集 的图像(原图像)得到追焦图像,并且对焦点所在的被拍摄对象(目标对象)实现图像追焦 和音频追焦。对目标对象实现图像追焦是指,生成的第一视频(追焦视频)的图像包括该目 标对象。实现音频追焦是指,生成的第一视频中该目标对象的声音被增强。在播放该第一视 频时,用户可以看到关于该目标对象的图像,以及清晰的听见该目标对象的声音,其他声音 被抑制,听不见或者听起来很小声。这样,在拍摄视频的过程中,可以针对目标对象拍摄关 于该目标对象的特写视频,且在录制视频的过程中,用户始终可以通过终端预览到原图像以 及该原图像对应的追焦图像,其实现方式可以参考说明书的描述,是以“画中画”的形式展 现的,这样可以提升用户体验感。在一次录制过程中,在生成第一视频(追焦视频)的同时, 还可以生成原视频,原视频可以看做是按照现有的拍摄方式得到的视频。这样,可以实现一 录多得。
[0008]结合第一方面,所述第一窗口中还包括第三控件,所述方法还包括:在没有检测到所述 第二操作的情况下,若检测到针对第三控件的操作,响应于针对第三控件的操作,保存有所 述第二视频。
[0009]上述实施例中,除了可以通过结束录像控件停止录制一个追焦视频以外,通过该追焦暂 停控件也可以实现停止录制一个追焦视频。实现了再录制原视频的过程中,可以随时停止一 个追焦视频的录制。
[0010]结合第一方面,所述预览界面还包括第四控件,检测到针对所述第一控件的第一操作之 前,所述方法还包括:在检测到针对第四控件的操作的情况下,响应于所述针对第四控件的 操作,更改所述第四控件的显示状态;或者,在检测到针对第四控件的操作的情况下,响应 于所述针对第四控件的操作,显示所述第五控件;所述第五控件用于提示所述终端可以录制 所述第一视频,所述第五控件还用于检测控制所述终端不开启录制所述第一视频的操作。
[0011]上述实施例中,在追焦控件的形式发生变化的情况下,用户可以确定此时终端进入了可 以录制追焦视频的模式(即说明书中涉及的特殊的录像模式)。
[0012]结合第一方面,所述第四控件还包括于所述录制界面,在没有检测到所述第四操作的情 况下,显示第一图像之后,显示所述第一图像以及第二图像之前,所述方法还包括:检测到 针对所述第四控件的操作;响应于针对所述第四控件的操作,更改所述第四控件的显示状态。
[0013]上述实施例中,在开始录制视频之前,如果没有启动录制追焦视频的模式,在开始录制 视频之后,仍然可以通过追焦控件启动录制追焦视频。使得终端触发拍摄追焦视频的方式多 元化,提升用户体验。
[0014]结合第一方面,基于对所述第一区域的第三操作,确定第一区域为焦点区域,具体包括: 检测到针对第一图像中第一区域的第六操作;所述第六操作作用于所述第一区域中第一位置; 响应于所述第六操作,将所述第一位置处的像素点设置为焦点,确定焦点所在的第一区域为 焦点区域。
[0015]上述实施例中,用户可以通过点击原图像中的某一个位置(第一位置)以确定焦点,例 如,如果用户想对第一对象进行追焦,则点击该第一对象即可。
[0016]结合第一方面,所述终端基于所述焦点区域对第一输入音频进行处理得到第一目标音频 以及第一噪声集合;所述第一噪声集合中包括T路噪声,所述T为大于等于1的整数;所述 第一目标音频中包括目标声音,所述目标声音为所述焦点所在的区域对应的声音,还包括部 分噪声;基于所述第一目标音频以及所述第一噪声集合进行滤波,滤除所述第一目标音频中 的噪声,得到第二目标音频;在基于所述输入音频做信号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法,其特征在于,应用于终端,所述终端包括摄像头,所述方法包括:所述终端启动相机;显示预览界面,所述预览界面包括预览框和第一控件;在所述预览框显示所述摄像头采集的第一图像,所述第一图像的第一区域包括第一对象;检测到针对所述第一控件的第一操作;响应于所述第一操作,开始录制,显示录制界面,所述录制界面包括所述预览框和第二控件;所述预览框显示第二图像,所述第二图像包括第一区域和第二区域,所述第一区域包括第一拍摄对象;基于对所述第一区域的第三操作,确定第一区域为焦点区域;显示第一窗口,所述第一窗口显示包括所述第一拍摄对象的第三图像;在第一时刻,预览框显示第四图像,所述第一窗口显示第五图像和获取第一输入音频,所述第四图像和所述第五图像都包括所述第一拍摄对象,所述第一输入音频包括所述第四图像的第一区域对应的声音以及所述第四图像的第二区域对应的声音;检测到对所述第二控件的第四操作,响应于所述第四操作,停止录制,保存第一视频和第二视频,所述第一视频为对应所述预览框的视频,所述第二视频为对应所述第一窗口的视频,其中,所述第二视频的所述第一时刻处包括所述第五图像和第一音频,所述第一音频对所述第一输入音频进行处理后得到的音频,所述第一音频包括对所述第四图像的所述第一区域对应的声音进行增强处理的声音以及所述第四图像的所述第二区域进行抑制处理后的声音。2.根据权利要求1所述的方法,其特征在于,所述第一窗口中还包括第三控件,所述方法还包括:在没有检测到所述第二操作的情况下,若检测到针对第三控件的操作,响应于针对第三控件的操作,保存有所述第二视频。3.根据权利要求1或2中任一项所述的方法,其特征在于,所述预览界面还包括第四控件,检测到针对所述第一控件的第一操作之前,所述方法还包括:在检测到针对第四控件的操作的情况下,响应于所述针对第四控件的操作,更改所述第四控件的显示状态;或者,在检测到针对第四控件的操作的情况下,响应于所述针对第四控件的操作,显示所述第五控件;所述第五控件用于提示所述终端可以录制所述第一视频,所述第五控件还用于检测控制所述终端不开启录制所述第一视频的操作。4.根据权利要求3所述的方法,其特征在于,所述第四控件还包括于所述录制界面,在没有检测到所述第四操作的情况下,显示第一图像之后,显示所述第一图像以及第二图像之前,所述方法还包括:检测到针对所述第四控件的操作;响应于针对所述第四控件的操作,更改所述第四控件的显示状态。5.根据权利要求1

4中任一项所述的方法,其特征在于,基于对所述第一区域的第三操
作,确定第一区域为焦点区域,具体包括:检测到针对第一图像中第一区域的第六操作;所述第六操作作用于所述第一区域中第一位置;响应于所述第六操作,将所述第一位置处的像素点设置为焦点,确定焦点所在的第一区域为焦点区域。6.根据权利要求1

5中任一项所述的方法,其特征在于,所述方法还包括:所述终端基于所述焦点区域对第一输入音频进行处理得到第一目标音频以及第一噪声集合;所述第一噪声集合中包括T路噪声,所述T为大于等于1的整数;所述第一目标音频中包括目标声音,所述目标声音为所述焦点所在的区域对应的声音,还包括部分噪声;基于所述第一目标音频以及所述第一噪声集合进行滤波,滤除所述第一目标音频中的噪声,得到第二目标音频;在基于所述输入音频做信号分离,得到第三目标音频的情况下;基于所述第二目标音频以及第三目标音频进行混音,得到第四目标音频;所述第三目标音频中包括所述目标声音;在基于所述输入音频做信号分离,没有得到第三目标音频的情况下;将所述第二目标音频作为第四目音频;基于所述第四目标音频得到第一音频。7.根据权利要求6所述的方法,其特征在于,所述终端基于所述焦点区域对第一输入音频进行处理得到第一目标音频以及第一噪声集合,具体包括:所述终端基于所述焦点所在的区域确定目标声音方向以及该目标声音方向对应的T个噪声方向;所述目标声音方向为所述目标声音对应的方向,所述噪声方向为噪声对应的方向;获取所述目标声音方向对应的滤波器系数以及每一个噪声方向对应的滤波器系数;基于所述目标声音方向对应的滤波器系数结合所述输入音频得到所述第一目标音频,以及分别基于T个噪声方向对应的滤波器系数结合所述输入音频得到T路噪声,将所述T路噪声作为第一噪声集合。8.根据权利要求6所述的方法,其特征在于,基于所述第一目标音频以及所述第一噪声集合进行滤波,滤除所述第一目标音频中的噪声,得到第二目标音频,具体包括:所述终端将所述第一目标音频作为参考对所述第一噪声集合进行滤波,滤除所述第一噪声集合中包括部分目标声音,得到第二噪声集合;将所述第二噪声集合作为参考对所述第一目标音频进行滤波,滤除所述第一目标音频中包括的噪声,得到所述第二目标音频。9.根据权利要求6所述的方法,其特征在于,基于所述第一目标音频以及所述第一噪声集合进行滤波,滤除所述第一目标音频中的噪声,得到第二目标音频,具体包括:所述终端将所述第一目标音频作为参考对所述第一噪声集合进行滤波,滤除所述第一噪声集合中包括的目标声音,得到第二噪声集合;将所述第二噪声集合作为参考对所述第一目标音频进行滤波,滤除所述第一目标音频中包括的噪声,得到滤波后的第一目标音频;所述终端基于滤波后的第...

【专利技术属性】
技术研发人员:刘镇亿玄建永曹国智
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1