【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种语音质量预测方法、装置、电子设备、存储介质及产品。
技术介绍
1、语音质量预测方法通常分为主观方法和客观方法。主观方法是人工对语音质量进行评分,如平均意见分数(mean opinion score,mos)等;客观方法是通过算法预测语音质量。
2、然而,主观方法耗时耗力且存在人工误差;客观方法通常只考虑语音信号特征,特征类型较为单一,并且提取的特征信息不够全面,特征表达能力较弱,从而导致语音质量预测效果差。
3、因此,如何提高语音质量预测效果是目前亟待解决的问题。
技术实现思路
1、本专利技术提供一种语音质量预测方法、装置、电子设备、存储介质及产品,用以解决现有技术中特征类型较为单一,并且提取的特征信息不够全面,特征表达能力较弱,导致语音质量预测效果差的缺陷,实现语音质量的准确预测。
2、本专利技术提供一种语音质量预测方法,包括:
3、获取待预测的视频通话结果的音频信号和视频信号;
4、将所述音频
...【技术保护点】
1.一种语音质量预测方法,其特征在于,包括:
2.根据权利要求1所述的语音质量预测方法,其特征在于,所述多尺度视频特征融合模块还包括三维卷积神经网络;所述将所述视频信号输入多尺度视频特征融合模块,得到多尺度视频特征,包括:
3.根据权利要求1所述的语音质量预测方法,其特征在于,所述多尺度音频特征融合模块包括二维卷积神经网络和自适应特征聚合层;所述将所述音频信号输入多尺度音频特征融合模块,得到多尺度音频特征,包括:
4.根据权利要求1所述的语音质量预测方法,其特征在于,所述根据所述多尺度音频特征和所述多尺度视频特征,预测所述视频通话结
...【技术特征摘要】
1.一种语音质量预测方法,其特征在于,包括:
2.根据权利要求1所述的语音质量预测方法,其特征在于,所述多尺度视频特征融合模块还包括三维卷积神经网络;所述将所述视频信号输入多尺度视频特征融合模块,得到多尺度视频特征,包括:
3.根据权利要求1所述的语音质量预测方法,其特征在于,所述多尺度音频特征融合模块包括二维卷积神经网络和自适应特征聚合层;所述将所述音频信号输入多尺度音频特征融合模块,得到多尺度音频特征,包括:
4.根据权利要求1所述的语音质量预测方法,其特征在于,所述根据所述多尺度音频特征和所述多尺度视频特征,预测所述视频通话结果的语音质量,包括:
5.根据权利要求4所述的语音质量预测方法,其特征在于,所述将所述多尺度音频特征和所述多尺度视频特征进行融合...
【专利技术属性】
技术研发人员:梁立涛,张桐童,马云飞,王鑫,王刚,
申请(专利权)人:中国移动通信集团北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。