一种数据处理方法、装置及设备制造方法及图纸

技术编号:39177861 阅读:12 留言:0更新日期:2023-10-27 08:25
本发明专利技术提供一种数据处理方法、装置及设备,其中,数据处理方法包括:获取第一音频数据及第一网络业务数据,所述第一网络业务数据包括采集所述第一音频数据时对应的网络侧产生的网络参数;对所述第一网络业务数据进行可用性分析处理,得到第一处理结果;对所述第一音频数据进行异常检测分析处理,得到第二处理结果;根据所述第一处理结果和所述第二处理结果,得到目标特征规则;利用所述目标特征规则对业务样本数据进行筛选,得到有效样本数据,所述有效样本数据用于训练音频质量评估预测模型。本发明专利技术的方案能够实现音频质量评估预测模型的训练数据的修正和清洗,使得音频质量评估预测模型的预测结果更加准确,从而保证对语音质量的精准评估。音质量的精准评估。音质量的精准评估。

【技术实现步骤摘要】
一种数据处理方法、装置及设备


[0001]本专利技术涉及通信
,特别是指一种数据处理方法、装置及设备。

技术介绍

[0002]随着网络的发展,作为运营商主流和基础业务的语音业务也随之发展的越来越完善,语音用户的数量在持续增加,VOLTE(Voice over Long

Term Evolution,长期演进语音承载)业务量也在逐年增长。随之而来的用户体验要求变得越来越高,其中VOLTE语音质量评估工作起到重要作用。
[0003]语音质量评估基于网络中全量语音业务通信特征数据如业务丢包率、相对时延、包间隔等,建立机器学习预测模型,对POLQA

MOS(感知客观听力质量评估

平均意见分数)分进行预测,POLQA

MOS分的高低衡量了语音质量的好坏。然而现有的机器学习预测模型忽略了预测模型训练阶段数据质量的检测,在数据的获取过程中,由于网络数据的复杂性,常常会出现脏数据,这些数据会对模型训练造成干扰,导致语音质量预测结果不准确。

技术实现思路

[0004]本专利技术要解决的技术问题是提供一种数据处理方法、装置及设备,保证语音质量预测模型训练的准确性。
[0005]为解决上述技术问题,本专利技术的技术方案如下:
[0006]一种数据处理方法,所述方法包括:
[0007]获取第一音频数据及第一网络业务数据,所述第一网络业务数据包括采集所述第一音频数据时对应的网络侧产生的网络参数;
[0008]对所述第一网络业务数据进行可用性分析处理,得到第一处理结果;
[0009]对所述第一音频数据进行异常检测分析处理,得到第二处理结果;
[0010]根据所述第一处理结果和所述第二处理结果,得到目标特征规则;
[0011]利用所述目标特征规则对业务样本数据进行筛选,得到有效样本数据,其中,所述有效样本数据用于训练音频质量评估预测模型。
[0012]可选的,对所述第一网络业务数据进行可用性分析处理,得到第一处理结果,包括:
[0013]对所述第一网络业务数据按照预设规范进行特征计算,得到所述第一网络业务数据的目标特征数据;
[0014]将所述目标特征数据与所述第一网络业务数据的原始特征数据进行对比分析处理,得到所述第一网络业务数据是否可用的第一处理结果。
[0015]可选的,所述目标特征数据和所述原始特征数据均包括以下至少一项:
[0016]丢包类特征数据;
[0017]时延类特征数据。
[0018]可选的,对所述第一音频数据进行异常检测分析处理,得到第二处理结果,包括:
[0019]对所述第一音频数据进行傅里叶变换,得到语谱图;
[0020]按照预设阈值对所述语谱图进行异常音频判断处理,得到第二处理结果。
[0021]可选的,按照预设阈值对所述语谱图进行异常音频判断处理,包括以下至少一项:
[0022]按照第一预设阈值,对所述语谱图进行音频异常截断判断处理;
[0023]按照第二预设阈值,对所述语谱图进行白噪音异常判断处理;
[0024]按照第三预设阈值,对所述语谱图进行空音频异常判断处理。
[0025]可选的,根据所述第一处理结果和所述第二处理结果,得到目标特征规则,包括:
[0026]将所述第二处理结果中正常的第一音频数据的质量标签与所述第一处理结果中可用的第一网络业务数据进行关联,得到具有质量标签的第一处理结果;
[0027]对所述第一处理结果中可用的第一网络业务数据,按照所述质量标签进行划分,得到至少一个样本集;
[0028]利用所述至少一个样本集对至少一个预设规则进行验证,根据验证结果从所述至少之一预设规则中选择目标特征规则。
[0029]可选的,获取所述第二处理结果中音频数据的质量标签,包括:
[0030]根据感知客观听力质量评估POLQA算法计算所述第二处理结果中的音频数据的平均意见分数MOS分;
[0031]根据所述MOS分,获得音频数据的质量标签。
[0032]可选的,利用所述至少一个样本集对至少一个预设规则进行验证,根据验证结果从所述至少之一预设规则中选择目标特征规则,包括:
[0033]遍历所述至少一个预设规则,判断所述样本集中的样本的至少一个特征重要性指标是否满足所述预设规则中的条件,获得满足所述预设规则中的条件的样本数量的统计结果;所述预设规则包括:至少一个特征重要性指标分别满足相应特征经验阈值的条件;
[0034]根据所述统计结果,从所述至少一个预设规则中选择目标特征规则。
[0035]可选的,根据所述统计结果,从所述至少一个预设规则中选择目标特征规则,包括:
[0036]将所述统计结果中满足至少一个精确率阈值的预设规则,确定为与相应精确率阈值对应的目标特征规则。
[0037]可选的,所述业务样本数据通过以下过程获得:
[0038]获取第二音频数据以及第二音频数据对应的第二网络业务数据;所述第二网络业务数据包括采集所述第二音频数据时对应的网络侧产生的网络参数;
[0039]对所述第二网络业务数据进行可用性分析处理,得到第三处理结果;
[0040]对所述第二音频数据进行异常检测处理,得到第四处理结果;
[0041]将所述第四处理结果中的第二音频数据的质量标签与所述第三处理结果进行关联,得到所述业务样本数据。
[0042]本专利技术的实施例还提供一种数据处理装置,所述装置包括:
[0043]获取模块,用于获取第一音频数据及第一网络业务数据,所述第一网络业务数据包括采集所述第一音频数据时对应的网络侧产生的网络参数;
[0044]第一处理模块,用于对所述第一网络业务数据进行可用性分析处理,得到第一处理结果;
[0045]第二处理模块,用于对所述第一音频数据进行异常检测分析处理,得到第二处理结果;
[0046]第三处理模块,用于根据所述第一处理结果和所述第二处理结果,得到目标特征规则;利用所述目标特征规则对业务样本数据进行筛选,得到有效样本数据,其中,用所述有效样本数据用于训练音频质量评估预测模型。
[0047]本专利技术还提供一种通信设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上所述的方法。
[0048]本专利技术还提供一种计算机可读存储介质,存储指令,当所述指令在计算机上运行时,使得计算机执行如上所述的方法。
[0049]本专利技术的上述方案至少包括以下有益效果:
[0050]本专利技术的上述方案,通过获取第一音频数据及第一网络业务数据,所述第一网络业务数据包括采集所述第一音频数据时对应的网络侧产生的网络参数;对所述第一网络业务数据进行可用性分析处理,得到第一处理结果;对所述第一音频数据进行异常检测分析处理,得到第二处理结果;根据所述第一处理结果和所述第二处理结果,得到目标特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取第一音频数据及第一网络业务数据,所述第一网络业务数据包括采集所述第一音频数据时对应的网络侧产生的网络参数;对所述第一网络业务数据进行可用性分析处理,得到第一处理结果;对所述第一音频数据进行异常检测分析处理,得到第二处理结果;根据所述第一处理结果和所述第二处理结果,得到目标特征规则;利用所述目标特征规则对业务样本数据进行筛选,得到有效样本数据,其中,所述有效样本数据用于训练音频质量评估预测模型。2.根据权利要求1所述的数据处理方法,其特征在于,对所述第一网络业务数据进行可用性分析处理,得到第一处理结果,包括:对所述第一网络业务数据按照预设规范进行特征计算,得到所述第一网络业务数据的目标特征数据;将所述目标特征数据与所述第一网络业务数据的原始特征数据进行对比分析处理,得到所述第一网络业务数据是否可用的第一处理结果。3.根据权利要求2所述的数据处理方法,其特征在于,所述目标特征数据和所述原始特征数据均包括以下至少一项:丢包类特征数据;时延类特征数据。4.根据权利要求1所述的数据处理方法,其特征在于,对所述第一音频数据进行异常检测分析处理,得到第二处理结果,包括:对所述第一音频数据进行傅里叶变换,得到语谱图;按照预设阈值对所述语谱图进行异常音频判断处理,得到第二处理结果。5.根据权利要求4所述的数据处理方法,其特征在于,按照预设阈值对所述语谱图进行异常音频判断处理,包括以下至少一项:按照第一预设阈值,对所述语谱图进行音频异常截断判断处理;按照第二预设阈值,对所述语谱图进行白噪音异常判断处理;按照第三预设阈值,对所述语谱图进行空音频异常判断处理。6.根据权利要求1所述的数据处理方法,其特征在于,根据所述第一处理结果和所述第二处理结果,得到目标特征规则,包括:将所述第二处理结果中正常的第一音频数据的质量标签与所述第一处理结果中可用的第一网络业务数据进行关联,得到具有质量标签的第一处理结果;对所述第一处理结果中可用的第一网络业务数据,按照所述质量标签进行划分,得到至少一个样本集;利用所述至少一个样本集对至少一个预设规则进行验证,根据验证结果从所述至少之一预设规则中选择目标特征规则。7.根据权利要求6所述的数据处理方法,其特征在于,获取所述第二处理结果中音频数据的质量标签,包括:根据感知客观听力质量评估POLQA算法计...

【专利技术属性】
技术研发人员:刘思佳李光宇陈扬铭梁燕萍余立冯俊兰
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1