语音识别算法评估方法、系统、移动终端及存储介质技术方案

技术编号:25443379 阅读:43 留言:0更新日期:2020-08-28 22:30
本发明专利技术提供了一种语音识别算法评估方法、系统、移动终端及存储介质,该方法包括:获取语音样本数据,获取背景语音样本的时域特征训练时域分类器;计算背景语音样本与有效语音样本之间的音量比,将能量比与对应语音样本信息进行存储,得到音量比数据库;获取背景语音样本的频域特征训练频域分类器;控制待测试语音识别算法对语音样本信息对进行测试,得到语音识别结果,根据语音样本文字获取语音识别结果中识别失败的失败样本;根据音量比数据库、时域分类器和频域分类器对失败样本进行评估分类,以得到算法评估结果。本发明专利技术能的从时域、音量比和频域三个场景角度对语音识别算法进行评估,以评估语音识别算法在不同应用场景下的识别效果。

【技术实现步骤摘要】
语音识别算法评估方法、系统、移动终端及存储介质
本专利技术属于语音识别
,尤其涉及一种语音识别算法评估方法、系统、移动终端及存储介质。
技术介绍
语音识别研究已有几十年的历史,语音识别技术主要包括声学模型建模、语言模型建模、发音词典构建以及解码四个部分,每一部分都可以成为一个单独的研究方向,并且相对于图像和文本,语音数据的采集和标注难度也大大提升,因此搭建一个完整的语音识别系统是个耗时极长、难度极高的工作,这极大阻碍了语音识别技术的发展。随着人工智能技术尤其是深度学习的研究和发展,一些基于端到端的语音识别算法被提出来,相较于传统语音识别方法,端到端语音识别方法简化了语音识别的流程,将大量工作交给了深度神经网络去学习和推理,因此在近些年得到了广泛关注。现有的语音识别过程中均是基于语音识别算法以达到对语音识别的效果,因此,为保障语音识别的准确性,针对语音识别算法的性能评估就尤为重要。但现有的语音识别算法评估过程中,仅基于语音识别算法的识别率以评估算法的性能,无法体现语音识别算法在不同应用场景下的识别效果,使得不同应用场景下的语音识别算本文档来自技高网...

【技术保护点】
1.一种语音识别算法评估方法,其特征在于,所述方法包括:/n获取语音样本数据,所述语音样本数据包括至少一个语音样本信息,所述语音样本信息包括背景语音样本、有效语音样本和语音样本文字;/n获取所述背景语音样本的时域特征,并根据所述时域特征训练时域分类器;/n计算所述语音样本信息中所述背景语音样本与所述有效语音样本之间的音量比,并将所述能量比与对应所述语音样本信息进行存储,得到音量比数据库;/n获取所述背景语音样本的频域特征,并根据所述频域特征训练频域分类器;/n控制待测试语音识别算法对所述语音样本信息对进行测试,得到语音识别结果,并根据所述语音样本文字获取所述语音识别结果中识别失败的失败样本;/...

【技术特征摘要】
1.一种语音识别算法评估方法,其特征在于,所述方法包括:
获取语音样本数据,所述语音样本数据包括至少一个语音样本信息,所述语音样本信息包括背景语音样本、有效语音样本和语音样本文字;
获取所述背景语音样本的时域特征,并根据所述时域特征训练时域分类器;
计算所述语音样本信息中所述背景语音样本与所述有效语音样本之间的音量比,并将所述能量比与对应所述语音样本信息进行存储,得到音量比数据库;
获取所述背景语音样本的频域特征,并根据所述频域特征训练频域分类器;
控制待测试语音识别算法对所述语音样本信息对进行测试,得到语音识别结果,并根据所述语音样本文字获取所述语音识别结果中识别失败的失败样本;
根据所述音量比数据库、所述时域分类器和所述频域分类器对所述失败样本进行评估分类,以得到算法评估结果。


2.如权利要求1所述的语音识别算法评估方法,其特征在于,所述获取所述背景语音样本的时域特征,并根据所述时域特征训练时域分类器的步骤包括:
获取所述背景语音样本中的短时能量特征、短时平均过零率、短时平均幅度差和零过零率比;
根据预设采样点对所述背景语音样本进行短时窗信号截取,得到采样信号,并根据预设自相关函数计算所述采样信号的自相关值;
构建所述时域分类器,并根据所述短时能量特征、所述短时平均过零率、所述短时平均幅度差、所述零过零率比和所述自相关值对所述时域分类器进行训练。


3.如权利要求1所述的语音识别算法评估方法,其特征在于,所述获取所述背景语音样本的频域特征,并根据所述频域特征训练频域分类器的步骤包括:
获取所述背景语音样本中的谱质心、子带能量、带宽、基音频率、小波熵和频谱流量;
构建所述频域分类器,并根据所述谱质心、所述子带能量、所述带宽、所述基音频率、所述小波熵和所述频谱流量对所述频域分类器进行训练。


4.如权利要求1所述的语音识别算法评估方法,其特征在于,所述根据所述音量比数据库、所述时域分类器和所述频域分类器对所述失败样本进行评估分类的步骤包括:
控制所述音量比数据库对所述失败样本中的背景失败样本进行音量分类,并根据音量分类结果计算各个音量段范围所对应的失败数量;
控制所述时域分类器对所述失败样本中的背景失败样本进行时域分类,并根据时域分类结果计算各个时域场景所对应的失败数量;
控制所述频域分类器对所述失败样本中的背景失败样本进行时域分类,并根据频域分类结果计算各个频域场景所对应的失败数量。


5.如权利要求4所述的语音识别算法评估方法,其特征在于,所述根据所述音量比数据库、所述时域分类器和所述频域分类器对所述失败样本进行评估分类的步骤还包括:
当判断到任一所述音量段范围所对应的失败数量大于第一预设数量时,则判定所述待测试语音识别算法在背景处于所述音量段范围内的语音识...

【专利技术属性】
技术研发人员:肖龙源李稀敏刘晓葳谭玉坤叶志坚
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1