一种流媒体的音视频处理方法、装置及设备制造方法及图纸

技术编号：38997790 阅读：17 留言：0更新日期：2023-10-07 10:29

本申请公开了一种流媒体的音视频处理方法、装置及设备，属于计算机技术领域。该方法主要包括获取流媒体的音视频数据中的待处理数据帧以及编码模块的目标数据；基于目标数据，构建与目标数据对应的随机森林预测模型，随机森林预测模型用于确定待处理数据帧的结构相似性预测评估值；基于结构相似性预测评估值，通过隐蔽效应的图像质量评估算法，确定音视频数据的目标结构相似性预测评估值；在目标结构相似性预测评估值满足预设条件的情况下，调整随机森林预测模型，得到目标编码模块，以通过目标编码模块对待处理数据帧进行编码，能够解决音视频数据处理效率低、稳定性差的问题。稳定性差的问题。稳定性差的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种流媒体的音视频处理方法、装置及设备

[0001]本申请属于计算机
，具体涉及一种流媒体的音视频处理方法、装置及设备。

技术介绍

[0002]随着无线通信网络采用了正交频分多址接入(Orthogonal FrequencyDivision Multiple Access，OFDMA)技术，第四代通讯技术(the 4Generationmobile communication technology，4G)/第五代移动通信技术(5th GenerationMobile Communication Technology，5G)网络承载带宽明显增强，扩充了音频、视频、电影动画等多媒体增值业务的传输容量和服务范围。为了满足人们日常工作与生活的需求，音视频业务展现形式多样化发展，短视频、线上会议、远程培训、视频监控等形式在各个应用领域发挥着重要作用。
[0003]但是，在相关技术中，音视频流模块所成图像的大小或尺寸大小不一，传输带宽、时延与实时网络条件均存在差异，影响用户服务体验感知，尤其在传输需求大、网络拥塞大等情况下，音视频出现卡顿和拥塞的现象频繁，降低音视频流处理效率。

技术实现思路

[0004]本申请实施例的目的是提供一种流媒体的音视频处理方法、装置及设备，能够解决音视频数据处理效率低、稳定性差的问题。
[0005]第一方面，本申请实施例提供了一种流媒体的音视频处理方法，其特征在于，包括：
[0006]获取流媒体的音视频数据中的待处理数据帧以及编码模块的目标数据，编码模块为...

【技术保护点】

【技术特征摘要】
1.一种流媒体的音视频处理方法，其特征在于，包括：获取流媒体的音视频数据中的待处理数据帧以及编码模块的目标数据，所述编码模块为对所述音视频数据进行编码的模块，所述目标数据为所述编码模块中编码历史数据帧所需的数据，所述历史数据帧为所述音视频数据中已编码的数据帧；基于所述目标数据，构建与所述目标数据对应的随机森林预测模型，所述随机森林预测模型用于确定所述待处理数据帧的结构相似性预测评估值；基于所述结构相似性预测评估值，通过隐蔽效应的图像质量评估算法，确定所述音视频数据的目标结构相似性预测评估值；在所述目标结构相似性预测评估值满足预设条件的情况下，调整所述随机森林预测模型，得到目标编码模块，以通过所述目标编码模块对所述待处理数据帧进行编码。2.根据权利要求1所述的方法，其特征在于，所述随机森林预测模型包括预测回归树，所述预测回归树中的叶子节点用于确定所述待处理数据帧的结构相似性预测评估值；所述基于所述目标数据，构建与所述目标数据对应的随机森林预测模型，包括：将训练样本输入初始随机森林预测模型，通过编码器在所述音视频数据集中随机选择待训练样本集，所述训练样本包括所述音视频数据和所述目标数据；基于所述待训练样本集，计算与所述待训练样本集对应的关键特征集合；基于所述关键特征集合，构建回归树，并按照预设特征优先级信息对所述关键特征集合中的关键特征进行优先排序，得到排序结果；基于所述排序结果，通过最小均方差的决策树特征划分所述回归树，得到所述预测回归树。3.根据权利要求2所述的方法，其特征在于，在所述基于所述结构相似性预测评估值，通过隐蔽效应的图像质量评估算法，确定所述音视频数据的目标结构相似性预测评估值之前，所述方法还包括：基于所述预测回归树中的每个叶子节点，轮询计算与所述每个叶子节点对应的结构相似性预测评估值。4.根据权利要求3所述的方法，其特征在于，所述基于所述结构相似性预测评估值，通过隐蔽效应的图像质量评估算法，确定所述音视频数据的目标结构相似性预测评估值，包括：对与所述每个叶子节点对应的结构相似性预测评估值，在隐蔽效应的介入下采用高斯加权，计算轮询过程中每一次的目标值，所述目标值包括均值、方差值和协方差值；将多个目标值的平均值确定为所述音视频数据的目标结构相似性预测评估值。5.根据权利要求4所述的方法，其特征在于，所述随机森林预测模型包括四叉树，所述四叉树包括在时间轴上前后相邻的至少两个子编码单元；所述对与所述每个叶子节点对应的结构相似性预测评估值，在隐蔽效应的介入下采用高斯加权，计算轮询过程中每一次的目标值，包括：分别计算所述前后相邻的至少两个子编码单元中每个子编码单元的第一率失真值，并基于所述每个子编码单元的第一率失真值，...

【专利技术属性】
技术研发人员：王文敏，李胜辉，程明，杨森轲，马俊鹏，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人