一种评估视频会议质量的方法、装置及计算机可读介质制造方法及图纸

技术编号：28878383 阅读：11 留言：0更新日期：2021-06-15 23:14

本发明专利技术公开了一种评估视频会议质量的方法、装置及计算机可读介质，属于人工智能技术领域。该方法包括：获取视频会议的多模态数据，多模态数据至少包括两种模态数据；对多模态数据分别进行编码处理，生成多模态表示；对多模态表示进行拼接处理或加和处理，生成融合向量；将融合向量作为训练样本，利用多个训练样本进行模型训练，生成评估模型；获取视频会议的待测多模态数据；利用评估模型对待测多模态数据进行预测，生成质量评估结果。由此能够基于评估模型对视频会议质量进行客观评估，提高了视频会议质量评估的准确性和时效性，解决了现有技术中视频会议质量评估准确率低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种评估视频会议质量的方法、装置及计算机可读介质
本专利技术涉及人工智能
，尤其涉及一种评估视频会议质量的方法、装置及计算机可读介质。
技术介绍
在当代办公流程中，视频会议逐步被普及，重要性也逐步凸显。视频会议质量的好坏直接反映视频会议的使用效果。为此需要对视频会议的质量进行有效的评估。传统的评估方式是采用问卷调查的方式进行的，采用问卷调查的方式不仅调查过程中需要耗费大量的人力，而且还需要专门设计调查内容，并且针对调查结果采用的是打分制，因此整个问卷调查过程中主观性比较强。因此，不能准确客观地评估视频会议的质量。
技术实现思路
为了解决上述现有技术存在的问题，本专利技术实施例提供一种评估视频会议质量的方法、装置及计算机可读介质，能够对视频会议的质量进行准确评估，提高视频会议质量评估的准确性和客观性。为实现上述目的，根据本专利技术实施例第一方面，提供一种评估视频会议质量的方法，该方法包括：获取视频会议的多模态数据，所述多模态数据至少包括两种模态数据；对所述多模态数据分别进行编码处理，生成多模态表示；对所述多模态表示进行拼接处理或加和处理，生成融合向量；将所述融合向量作为训练样本，利用多个所述训练样本进行模型训练，生成评估模型；获取视频会议的待测多模态数据；利用所述评估模型对所述待测多模态数据进行预测，生成质量评估结果。可选的，所述多模态数据为视频图像数据、音频数据和文本数据；所述对所述多模态数据分别进行编码处理，生成多模态表示，包括：对所述视频图像数据进行编码处理，生成...

【技术保护点】
1.一种评估视频会议质量的方法，其特征在于，包括：/n获取视频会议的多模态数据，所述多模态数据至少包括两种模态数据；/n对所述多模态数据分别进行编码处理，生成多模态表示；/n对所述多模态表示进行拼接处理或加和处理，生成融合向量；/n将所述融合向量作为训练样本，利用多个所述训练样本进行模型训练，生成评估模型；/n获取视频会议的待测多模态数据；/n利用所述评估模型对所述待测多模态数据进行预测，生成质量评估结果。/n

【技术特征摘要】
1.一种评估视频会议质量的方法，其特征在于，包括：
获取视频会议的多模态数据，所述多模态数据至少包括两种模态数据；
对所述多模态数据分别进行编码处理，生成多模态表示；
对所述多模态表示进行拼接处理或加和处理，生成融合向量；
将所述融合向量作为训练样本，利用多个所述训练样本进行模型训练，生成评估模型；
获取视频会议的待测多模态数据；
利用所述评估模型对所述待测多模态数据进行预测，生成质量评估结果。

2.根据权利要求1所述的方法，其特征在于，所述多模态数据为视频图像数据、音频数据和文本数据；所述对所述多模态数据分别进行编码处理，生成多模态表示，包括：
对所述视频图像数据进行编码处理，生成图像表示；
对所述音频数据进行编码处理，生成音频表示；
对所述文本数据进行编码处理，生成文本表示；
将所述图像表示、音频表示和文本表示确定为多模态表示。

3.根据权利要求2所述的方法，其特征在于，所述视频图像数据通过如下方法获得：
获取视频图像源数据以及视频时长；
基于所述视频图像源数据和所述视频时长，确定发生特定事件的高频时段；
从所述视频图像源数据中选取所述高频时段的所有视频源图像，得到视频源图像子数据；
从所述视频源图像子数据中抽取特定数量的视频源图像，得到视频图像数据。

4.根据权利要求2所述的方法，其特征在于，所述对所述视频图像数据进行编码处理，生成图像表示，包括：
对所述视频图像数据进行编码，生成图像向量；
将所述图像向量确定为图像表示。

5.根据权利要求2所述的方法，其特征在于，所述对所述音频数据进行编码处理，生成音频表示，包括：
识别所述音频数据中无效音频数据，并从所述音频数据中剔除所述无效音频数据；
对剔除后剩余的音频数据进行组合，生成有效音频数据；
获取音频数据的总时长，以及有效音频数...

【专利技术属性】
技术研发人员：曹亚曦，许磊，
申请(专利权)人：浙江华创视讯科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人