基于机器学习的视频会议声音延迟检测方法及系统技术方案

技术编号：42071024 阅读：21 留言：0更新日期：2024-07-19 16:52

本发明专利技术涉及语音分析技术领域，具体涉及一种基于机器学习的视频会议声音延迟检测方法及系统，包括：在视频会议时采集视频数据和每个设备在每个时刻的声音振动数据；根据每个设备与其他设备的声音振动数据在每个预设的延迟时间下的数据差异，对所述延迟时间进行筛选，得到每两个设备在最优延迟时间下的匹配关联度；根据每个设备在每个时刻与其他设备在最优延迟时间下的声音振动数据之间的差异分布、所述匹配关联度得到数据稳定程度，获得每个设备在每个时刻的数据贡献程度；基于数据贡献程度进行特征分解，将特征分解结果和视频数据进行内容匹配，获得视频会议声音延迟的检测结果。本发明专利技术利用特征分解结果进行音画匹配的结果更加准确。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音分析，具体涉及一种基于机器学习的视频会议声音延迟检测方法及系统。

技术介绍

1、视频会议能够使得会议的地点不存在局限性，同时通过保存视频数据可以有效保存视频会议的内容。视频会议的主要形式是视频通话，由于网络波动或者传输时的信号噪声等问题，可能会导致声音数据与视频数据不同步，音画不同步导致用户使用的体验感较差。因此，通过对视频会议的视频数据和声音数据进行音画同步情况进行分析就显得尤为重要，可以降低音画不同步的延迟干扰。一般常通过匹配视频数据和声音数据的时间戳对声音的延迟情况进行检测，但是声音数据中可能存在一部分的噪声数据影响，导致时间戳匹配结果不准确，进而影响声音延迟检测结果。

2、现有常利用ica算法对声音数据进行预处理提取声音数据的不同独立程度，这些独立成分代表了声音中不同的源，使得在音画匹配过程中能够更精确地识别和处理不同来源的声音，从而提高音画匹配结果的准确性。但是声音数据在传输过程中产生的丢包、延迟等问题可能会影响声音数据特征分解的数据对应关系，导致不同源的声音数据划分混乱，使得每个分解成分可能包含...

【技术保护点】

1.一种基于机器学习的视频会议声音延迟检测方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的一种基于机器学习的视频会议声音延迟检测方法，其特征在于，所述根据每个设备的声音振动数据与其他设备的声音振动数据在每个预设的延迟时间下的数据差异分布情况，以及每任意两个设备在所述延迟时间下的数据差异，对所述延迟时间进行筛选，得到每两个设备在最优延迟时间下的匹配关联度，具体包括：

3.根据权利要求2所述的一种基于机器学习的视频会议声音延迟检测方法，其特征在于，所述数据稳度的获取方法具体为：

4.根据权利要求3所述的一种基于机器学习的视频会议声音延迟检测...

【技术特征摘要】

1.一种基于机器学习的视频会议声音延迟检测方法，其特征在于，该方法包括以下步骤：

3.根据权利要求2所述的一种基于机器学习的视频会议声音延迟检测方法，其特征在于，所述数据稳度的获取方法具体为：

4.根据权利要求3所述的一种基于机器学习的视频会议声音延迟检测方法，其特征在于，所述匹配关联度的获取方法具体为：

5.根据权利要求4所述的一种基于机器学习的视频会议声音延迟检测方法，其特征在于，所述对设备与任意一个其他设备在每个延迟时间下的匹配关联度进行筛选，确定最优延迟时间，具体包括：

6.根据权利要求1所述的一种基于机器学习的视频会议声音延迟检测方法，其特征在于，所述根据每个设备在每个时刻与其他设备在最...

【专利技术属性】
技术研发人员：雷镕嘉，司佳，武志栋，李雅西，陈思平，杨艺西，仇亚骏，刘翰文，王熙乾，何宇泽，苏童，周倩，吕剑书，田丽，樊明葆，文涛，
申请(专利权)人：国家电网有限公司信息通信分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人