语音识别准确性的检测方法、装置、设备及存储介质制造方法及图纸

技术编号：39300020 阅读：24 留言：0更新日期：2023-11-12 15:51

本发明专利技术属于语音识别技术领域，具体涉及一种语音识别准确性的检测方法、装置、设备及存储介质。本发明专利技术提供的一种语音识别准确性的检测方法、装置、设备及存储介质，通过获取用户语音交互记录的第一生成时间，并根据第一生成时间，从终端设备上报的第一用户的运行数据中查找第一运行数据，当第一运行数据中存在模式取消指令时，根据模式取消指令对应的取消时间，从第一用户的运行数据中查找第二运行数据，当第二运行数据中存在模式开启指令时，则将语音交互记录标记为语音识别错误，当第二运行数据中不存在模式开启指令时，则将语音交互记录标记为非语音识别错误。本发明专利技术的方法，提高了ASR语音转文字准确性的获取效率。语音转文字准确性的获取效率。语音转文字准确性的获取效率。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别准确性的检测方法、装置、设备及存储介质

[0001]本专利技术涉及语音识别
，尤其涉及一种语音识别准确性的检测方法、装置、设备及存储介质。

技术介绍

[0002]自动语音识别技术(Automatic Speech Recognition，简称ASR)，是一种将人的语音转化为文本的技术，在语音交互场景中得到了广泛应用。
[0003]目前，ASR应用于设备时，其用户与设备的语音交互流程为：截取用户语音
‑
ASR语音转文字
‑
自然语言处理(Natural Language Processing，简称NLP)识别文字意图
‑
反馈指令。就现有数据而言，NLP识别文字意图及后续反馈指令错误的可能性较小，极大一部分交互失败都是ASR语音识别错误造成的，语音转文字错误导致识别意图错误。目前对于识别ASR语音转文字的准确性，往往都是通过人工听取音频获知。
[0004]由于用户与机器的语音交互过程中，产生的语音数据量较大，所以通过人工听取音频获知ASR语音转文字...

【技术保护点】

【技术特征摘要】
1.一种语音识别准确性的检测方法，其特征在于，包括：获取第一用户的语音交互记录的第一生成时间；从终端设备上报的所述第一用户的运行数据中查找第一运行数据，所述第一运行数据为所述第一生成时间之后的第一时间段内的运行数据；当所述第一运行数据中存在模式取消指令，从所述第一用户的运行数据中查找第二运行数据，所述第二运行数据为所述取消时间之后的第二时间段内的运行数据；当所述第二运行数据中存在模式开启指令，则标记所述第一语音交互记录发生了语音识别错误；当所述第二运行数据中不存在模式开启指令，则标记所述第一语音交互记录发生了非语音识别错误。2.根据权利要求1所述的方法，其特征在于，还包括：当所述第一运行数据中不存在模式取消指令，则标记所述第一语音交互记录正确。3.根据权利要求1所述的方法，其特征在于，所述第一时间段小于所述终端设备在当前运行模式下的最长工作时间。4.根据权利要求3所述的方法，其特征在于，所述第一用户的运行数据中包括所述终端设备当前的运行模式，所述根据所述第一生成时间，从终端设备上报的所述第一用户的运行数据中查找第一运行数据之前，还包括：根据所述终端设备当前的运行模式，确定所述设备在当前运行模式下的结束时间；根据所述第一生成时间和所述结束时间，确定时间差；根据所述时间差确定所述第一时间段，所述第一时间段小于或等于所述时间差。5.根据权利要求3所述的方法，其特征在于，所述根据所述第一生成时间，从终端设备上报的所述第一用户的运行数据中查找第一运行数据之前，还包括：根据多个用户的运行数据，获取多个用户的模式取消数据，所述模式取消数据包括模式的开启时间和取消时间；根据所述多个用户的模式取消数据，计算模式的平均取消时长；根据所述平均取消时长确定所述第一时间段。6.根据权利要求5所述的方法，其特征在于，所述第一用户的运行数据中包括所述终端设备当前的运行模式，根据所述平均取消时长确定所述第一时间段，包括：根据所述终端设备当前的运行模式，确定所述设备在当前运行模式下的结束时间；根据所述第一生成时间和所述结束时间，确定时间差；判断所述平均取消时长是否小于所述时间差；当所述平均取消时长小于所述时间差时，确定所述平均取消时长为所述第一时间段当所述平均取消时长不小于所述时间差时，确定所述时间差为所述第一时间段。7.根据权利要求1
‑
6任一项所述的方法，其特征在于，还包括：根据多个用户的运行数据，获取多个用户的模式重启数据，所述模式重启数据包括第一模式的取消时间和第二模式的开启时间；根据所述多个用户的模式重启数据，计算模式的平均重启时长；确定所述模式的平均重启时长为所述第二时间段。8.根据权利要求1
‑
6任一项所述的方法，其特征在于，所述语音交互记录中包括以下至
少一个信息：所述第一用户的标识、语音数据、语音数据的识别结果、语音交互记录的生成时间、语音数据对应的用户意图、所述用户意图对应的执行指令；所述方法还包括：接收所述终端设备上报的采集数据，所述采集数据中包括所述第一用户的标识和语音数据；根据所述语音数据进行语音识别得到所述语音数据对应的文本；对所述语音数据对应的文本进行意图识别，得到所述语音数据对应的用户意图；根据所述用户意...

【专利技术属性】
技术研发人员：武婧文，邹存璐，许升，
申请(专利权)人：海尔智家股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人