一种基于语音识别的视频会议图像跟踪方法及系统技术方案

技术编号：41870964 阅读：28 留言：0更新日期：2024-07-02 00:21

本发明专利技术属于通信技术领域，公开了一种基于语音识别的视频会议图像跟踪方法及系统，包括配置语音识别系统，对参会人员进行样本声音的采集，特征提取获得音频特征，和对应的个人身份信息存储于特征数据库；获取会议内的声音信息，通过语音识别技术识别当前发言人的声音特征，与特征数据库进行匹配，获取对应的个人身份信息；当前发言人移动时，根据声阈的变化驱动视频跟踪单元跟踪，并相应地更新其图像信息；结合声音传播特点连贯准确地追踪到发言人，对硬件要求更低，计算量相对较小，通过语音识别技术实现视频会议中的图像跟踪，降低了对环境条件的限制，显著提高了会议的互动性和管理效率，在各种场景下都能保持高效的识别和跟踪性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及通信，尤其涉及一种基于语音识别的视频会议图像跟踪方法及系统。

技术介绍

1、随着商务活动的加速和远程工作模式的普及，视频会议成为了企业沟通和协作的重要工具；视频会议能够跨越地理和时间的限制，让团队成员即使身处世界各地也能实时交流和协作。然而，随着参与者人数的增加和会议复杂度的提高，如何有效地识别和追踪会议中的发言人，以及如何提升会议的互动性和参与感成为迫切需要解决的问题。

2、现有技术中的视频会议系统主要依靠图像识别技术，如人脸识别，来追踪和显示与会人员的图像，这种方法虽然在一定程度上能够实现人员的自动识别和图像追踪，但其存在明显的缺点；首先，人脸识别技术对环境的光线和参与者的面部朝向有很高的要求，一旦条件不满足，其识别精度和可靠性会大幅下降。其次，随着会议参与者数量的增加，图像处理和识别的复杂度和计算量也随之增加，这不仅增加了系统的硬件要求，也可能导致识别延迟，影响会议流畅度。最后，传统的人脸识别方法无法有效解决发言人移动或多人同时在画面中发言的情况，容易造成图像跟踪的混乱或错误。

3、鉴于此，需...

【技术保护点】

1.一种基于语音识别的视频会议图像跟踪方法，其特征在于，包括：

2.根据权利要求1所述的基于语音识别的视频会议图像跟踪方法，其特征在于，所述配置语音识别系统，通过所述语音识别系统对参会人员进行样本声音的采集，并对采集的样本声音进行特征提取，获得音频特征，将所述音频特征和对应的个人身份信息存储于所述特征数据库；具体包括：

3.根据权利要求1所述的基于语音识别的视频会议图像跟踪方法，其特征在于，所述根据识别的所述声音特征与所述特征数据库进行匹配，获取对应的个人身份信息，在显示界面上显示视频跟踪单元获取的图像信息和对应的个人身份信息；具体包括：>

4.根据权利...

【技术特征摘要】

1.一种基于语音识别的视频会议图像跟踪方法，其特征在于，包括：

3.根据权利要求1所述的基于语音识别的视频会议图像跟踪方法，其特征在于，所述根据识别的所述声音特征与所述特征数据库进行匹配，获取对应的个人身份信息，在显示界面上显示视频跟踪单元获取的图像信息和对应的个人身份信息；具体包括：

4.根据权利要求3所述的基于语音识别的视频会议图像跟踪方法，其特征在于，所述将所述个人身份信息嵌入到所述图像信息中，之后还包括：

5.根据权利要求1所述的基于语音识别的视频会议图像跟踪方法，其特征在于，所述语音识别系统持续获取会议内的声音信息，通过判断声音信息的波强变化，判断当前发言...

【专利技术属性】
技术研发人员：黄明洁，骆金鑫，
申请(专利权)人：深圳市北电正光科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人