视频对焦方法及装置制造方法及图纸

技术编号：30434515 阅读：23 留言：0更新日期：2021-10-24 17:32

本申请公开了一种视频对焦方法、装置及设备，所述方法包括：获取视频场景中的语音数据，提取所述语音数据的声纹特征；将所述语音数据的声纹特征与预先存储的声纹特征进行匹配，确定所述预先存储的声纹特征中匹配上的目标声纹特征；识别出所述视频场景中与所述目标声纹特征匹配的目标对象，对所述目标对象的面部进行对焦或追焦。采用所述方法，解决了视频采集时无法跟随声音对焦的问题。时无法跟随声音对焦的问题。时无法跟随声音对焦的问题。

全部详细技术资料下载

【技术实现步骤摘要】
视频对焦方法及装置

[0001]本申请涉及视频处理
，具体涉及视频对焦方法、装置及设备。本申请还涉及一种数据处理方法。

技术介绍

[0002]在视频应用系统中，视频采集时往往需要对一个或几个对象进行清晰显示，因此需要对目标对象进行对焦。例如，直播或者视频会议或者视频通话或者录制视频。
[0003]现有技术中如果采用手动对焦，则焦点是固定的，给视频采集带来极大不便。如果是自动对焦，往往根据待拍摄场景中各对象的远近层次、光线等环境参数进行对焦，则难以适应需要跟随声音对焦的场景。例如，对于直播带货场景，由单一主播逐渐发展出多主播连播、多人同镜头直播等形式，但是直播中无法跟随声音对焦，常出现一位主播讲话而镜头却对焦了另一位主播的情况，给用户带来人声不同步的感觉，导致用户的体验断层。
[0004]因此，提供合理的视频对焦方式以避免视频采集时无法跟随声音对焦的情形，是需要解决的问题。

技术实现思路

[0005]本申请实施例提供的视频对焦方法，解决了视频采集时无法跟随声音对焦的问题。
[000...

【技术保护点】

【技术特征摘要】
1.一种视频对焦方法，其特征在于，包括：获取视频场景中的语音数据，提取所述语音数据的声纹特征；将所述语音数据的声纹特征与预先存储的声纹特征进行匹配，确定所述预先存储的声纹特征中匹配上的目标声纹特征；识别出所述视频场景中与所述目标声纹特征匹配的目标对象，对所述目标对象的面部进行对焦或追焦。2.根据权利要求1所述的方法，其特征在于，所述获取视频场景中的语音数据，包括：采集所述视频场景中的所有声音，对所述声音进行过滤处理，得到所述语音数据。3.根据权利要求2所述的方法，其特征在于，所述采集所述视频场景中的所有声音，对所述声音进行过滤处理，得到所述语音数据，包括：根据预设的噪音频率范围过滤所述声音中的噪音，提取出所述语音数据；或者，根据预设的噪音强度阈值过滤所述声音中的噪音，提取出所述语音数据。4.根据权利要求1所述的方法，其特征在于，所述提取所述语音数据的声纹特征，包括：获取所述语音数据中当前语音帧的频率值和/或相邻语音帧的频率值，根据所述当前语音帧的频率值和/或相邻语音帧的频率值确定所述语音数据的声纹特征。5.根据权利要求1所述的方法，其特征在于，还包括：采集所述目标对象的声音数据，根据所述声音数据提取所述目标对象的声纹特征；采集所述目标对象的视觉形象，提取所述视觉形象的视觉形象特征；将所述声纹特征与所述视觉形象特征关联存储；所述目标对象的声纹特征为预先存储的声纹特征。6.根据权利要求5所述的方法，其特征在于，所述采集所述目标对象的声音数据，根据所述声音数据提取所述目标对象的声纹特征，包括：在多种场景中采集所述目标对象的不同声音强度的声音，对采集到的不同...

【专利技术属性】
技术研发人员：盛娇麒，刘东婷，
申请(专利权)人：口碑上海信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人