语音识别的评估方法、装置、设备及存储介质制造方法及图纸

技术编号：39058511 阅读：21 留言：0更新日期：2023-10-12 19:51

本公开提供了语音识别的评估方法、装置、设备及存储介质，本公开涉及数据处理技术领域，尤其涉及人工智能、语音技术、语音识别技术领域。具体实现方案为：确定用户端上传的初始音频的第一识别文本；对用户端上传的第二音频进行语音识别，得到第二识别文本，其中，初始音频与第二音频关联；根据第一识别文本和上传文本，得到留存率参数，其中，上传文本基于第一识别文本得到；根据上传文本和第二识别文本，得到准确率参数；以及根据留存率参数和准确率参数，得到评估结果。本公开可以实时对语音识别结果进行客观评估，无需人工参与和标注。无需人工参与和标注。无需人工参与和标注。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别的评估方法、装置、设备及存储介质

[0001]本公开涉及数据处理
，尤其涉及人工智能、语音技术、语音识别

技术介绍

[0002]针对语音识别系统的优化，需要先评估语音识别的效果，这通常需要由人工对音频数据中准确文字和断句进行标注，将标注结果与语音识别的结果进行对比，得出识别准确率，从而辅助语音识别系统所包含的算法或模型进行优化。

技术实现思路

[0003]本公开提供了一种语音识别的评估方法、装置、设备以及存储介质。
[0004]根据本公开的一方面，提供了一种语音识别的评估方法，包括：
[0005]确定用户端上传的初始音频的第一识别文本；
[0006]对所述用户端上传的第二音频进行语音识别，得到第二识别文本；其中，所述初始音频与所述第二音频关联；
[0007]根据所述第一识别文本和上传文本，得到留存率参数；其中，所述上传文本基于所述第一识别文本得到；
[0008]根据所述上传文本和所述第二识别文本，得到准确率参数；以及
[0009]根据所述...

【技术保护点】

【技术特征摘要】
1.一种语音识别的评估方法，包括：确定用户端上传的初始音频的第一识别文本；对所述用户端上传的第二音频进行语音识别，得到第二识别文本；其中，所述初始音频与所述第二音频关联；根据所述第一识别文本和上传文本，得到留存率参数；其中，所述上传文本基于所述第一识别文本得到；根据所述上传文本和所述第二识别文本，得到准确率参数；以及根据所述留存率参数和所述准确率参数，得到评估结果。2.根据权利要求1所述的方法，还包括：对用户端上传的初始音频进行语音识别，得到第一识别文本。3.根据权利要求1所述的方法，其中，根据所述上传文本和所述第二识别文本，得到准确率参数，包括：根据所述上传文本与所述第二识别文本之间的差异，确定字准率和句准率；根据所述字准率和所述句准率，得到准确率参数。4.根据权利要求3所述的方法，其中，根据所述上传文本与所述第二识别文本之间的差异，确定字准率和句准率，包括：根据所述上传文本与所述第二识别文本中的多个对应字符之间的编辑距离，确定字准率；根据所述上传文本与所述第二识别文本中的多个对应句子的启动时间戳之间的差值和结束时间戳之间的差值，确定句准率。5.根据权利要求1所述的方法，其中，根据所述第一识别文本和上传文本，得到留存率参数，包括：根据所述第一识别文本和所述上传文本，确定字留存率和句留存率；根据所述字留存率和所述句留存率，得到留存率参数。6.根据权利要求5所述的方法，其中，根据所述第一识别文本和所述上传文本，确定字留存率和句留存率，包括：确定所述第一识别文本所包含的多个文字和多个句子是否经过编辑；确定所述第一识别文本中未经过编辑的文字在全部文字中的占比，以得到字留存率；确定所述第一识别文本中未经过编辑的句子在全部句子中的占比，以得到句留存率。7.根据权利要求1至6任一项所述的方法，其中，所述初始音频和所述第二音频基于相关联的视频文件所包含的音轨数据得到，所述上传文本为所述视频文件对应的字幕文本。8.一种语音识别的评估装置，包括：确定模块，用于确定用户端上传的初始音频的第一识别文本；识别模块，用于对所述用户端上传的第二音频进行语音识别，得到第二识别文本；其中，所述初始音频与所述第二音频关联；第一计算模块，用于根据所述第一识别文本和上传文本，得到留存率参数；其中，所...

【专利技术属性】
技术研发人员：董良，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人