检测方法、语音交互检测装置、设备及非易失性存储介质制造方法及图纸

技术编号:34104738 阅读:14 留言:0更新日期:2022-07-12 00:13
本发明专利技术提供了一种检测方法、语音交互检测装置、设备及非易失性存储介质,检测方法包括:获取识别响应检测指令;控制语音播放模块播放第一唤醒音频文件;获取语音交互设备根据第一唤醒音频文件所生成的第一响应数据;根据第一响应数据以及语音交互设备的第一响应时长判断语音交互设备是否唤醒成功;在语音交互设备唤醒成功后,控制语音播放模块播放技能命令音频文件,获取根据技能命令音频文件所生成的第二响应数据,根据第二响应数据以及语音交互设备的第二响应时长判断语音交互设备识别响应检测是否成功。本发明专利技术的检测方法解决了现有技术中由于语音交互设备的响应检测方法自动化程度较低所导致的测试效率低、成本高,检测结果可靠性低的问题。果可靠性低的问题。果可靠性低的问题。

【技术实现步骤摘要】
检测方法、语音交互检测装置、设备及非易失性存储介质


[0001]本专利技术涉及语音交互领域,具体而言,涉及一种检测方法、语音交互检测装置、设备及非易失性存储介质。

技术介绍

[0002]随着语音识别技术,自然语音处理技术,语音合成技术的发展,以语音识别、处理、合成为核心的语音交互技术产品已经涉及家电、通讯、汽车电子、医疗、家庭服务、电子消费市场、工业等各个领域。语音交互产品通常由语音交互硬件设备和语音交互服务系统云平台组成,两者通过网络连接为用户提供定制化的语音交互服务。在语音交互产品研发和测试过程中,会对语音交互产品进行响应方面的各项测试,语音响应的效果直接影响产品本身的价值,如何能够及时发现并解决语音响应方面的各种问题,这对于缩短研发周期、减少后续的生产成本、提高产品质量和生产效率有着至关重要的作用。
[0003]目前,基于在语音交互产品研发及测试过程中涉及的语音设备响应功能和性能检测方面,存在以下技术问题:
[0004]现有的检测方法是基于纯人工或者半自动化的方式对设备的响应进行检测。在该方式下,检测人员需时刻与语音设备保持交互状态,对语音交互指令测试集(包括唤醒语音指令测试集和技能命令语音指令测试集)进行口述播报,检测人员在各种测试场景下时刻与待测语音设备保持交互状态,随着测试样本的增多,检测人员的工作量也不断加大,存在口述播报错误的概率也不断增加,存在人工测试效率低、成本高,检测结果可靠性低等问题。
[0005]现有的检测方法没有以自动化的方式对响应结果数据进行实时筛选及提取,错误统计分析判断,而是通过人为地去判定及统计分析各种错误问题,不能根据实际的响应数据在测试结果输出中自动判定各种功能错误和性能缺陷,存在设备检测结果不够全面直观,检测覆盖范围小等问题。

技术实现思路

[0006]本专利技术的主要目的在于提供一种检测方法、语音交互检测装置、设备及非易失性存储介质,以解决现有技术中由于语音交互设备的响应检测方法自动化程度较低所导致的测试效率低、成本高,检测结果可靠性低的问题。
[0007]为了实现上述目的,根据本专利技术的第一个方面,提供了一种语音交互设备的检测方法,包括:获取识别响应检测指令;控制语音播放模块播放第一唤醒音频文件;获取语音交互设备根据第一唤醒音频文件所生成的第一响应数据;根据第一响应数据以及语音交互设备的第一响应时长判断语音交互设备是否唤醒成功;当第一响应数据中包含第一预设信息且第一响应时长小于第一预设时长时,语音交互设备唤醒成功,否则语音交互设备唤醒失败;在语音交互设备唤醒成功之后,控制语音播放模块播放技能命令音频文件,获取语音交互设备发送的根据技能命令音频文件所生成的第二响应数据,根据第二响应数据以及语
音交互设备的第二响应时长判断语音交互设备识别响应检测是否成功;其中,当第二响应数据中包含与技能命令音频文件相匹配的第二预设信息且第二响应时长小于第二预设时长时,判断语音交互设备识别响应检测成功,否则判断语音交互设备识别响应检测失败。
[0008]进一步地,当进行离线识别响应检测时,第二响应数据为语音交互设备根据技能命令音频文件所生成的。
[0009]进一步地,当进行离线识别响应检测时,根据第二响应数据以及语音交互设备的第二响应时长判断语音交互设备识别响应检测是否成功的方法包括:当第二响应数据中包含与技能命令音频文件相对应的标准文本相同的第二预设信息且第二响应时长小于第二预设时长时,判断语音交互设备识别响应检测成功,否则语音交互设备识别响应检测失败。
[0010]进一步地,当进行在线识别响应检测时,获取语音交互设备发送的根据技能命令音频文件所生成的第二响应数据的方法包括:通过语音交互设备将技能命令音频文件发送给语音交互系统云平台;利用语音交互系统云平台根据技能命令音频文件生成第二响应数据,并将第二响应数据发送至语音交互设备,以使语音交互设备发送第二响应数据。
[0011]进一步地,利用语音交互系统云平台根据技能命令音频文件生成第二响应数据,并将第二响应数据发送至语音交互设备的方法包括:通过语音交互系统云平台的ASR模块将技能命令音频文件转化为文本信息;通过语音交互系统云平台的NLU模块对文本信息进行语意理解并生成响应文本信息;通过语音交互系统云平台的TTS模块将响应文本信息转化为响应音频文件;通过语音交互系统云平台将文本信息、响应文本信息和响应音频文件均发送给语音交互设备;其中,第二响应数据包括文本信息、响应文本信息和响应音频文件。
[0012]进一步地,当进行在线识别响应检测时,根据第二响应数据以及语音交互设备的第二响应时长判断语音交互设备识别响应检测是否成功的方法包括:当第二响应数据中包含与技能命令音频文件相对应的语义准确的第二预设信息且第二响应时长小于第二预设时长时,语音交互设备识别响应检测成功,否则语音交互设备识别响应检测失败。
[0013]进一步地,语音交互设备的检测方法还包括:获取语音指令测试集,并对语音指令测试集进行领域类别划分;采用邻近算法对语音指令测试集的领域类别划分进行机器学习训练,并获得训练后的领域模型;当进行在线识别响应检测时,第二响应数据中包含与技能命令音频文件相对应的语义准确的第二预设信息的判定方法包括:根据领域模型采用邻近算法对第二响应数据中的文本进行归类判定,当归类判定正确时,判断第二响应数据中包含与技能命令音频文件相对应的语义准确的第二预设信息;否则,第二响应数据中未包含与技能命令音频文件相对应的语义准确的第二预设信息。
[0014]进一步地,根据第二响应数据以及语音交互设备的第二响应时长判断语音交互设备识别响应检测是否成功的方法包括:根据第二响应数据中的文本以及语音交互设备的第二响应时长判断语音交互设备识别响应检测是否成功,当文本为与技能命令音频文件相对应的语义准确的第二预设信息且第二响应时长小于第二预设时长时,语音交互设备识别响应检测成功,否则语音交互设备识别响应检测失败;其中,文本包括第一领域文本和第一意图文本;语音交互设备的检测方法还包括:将第二响应数据中的文本发送至语音交互系统云平台进行二次语义理解;通过语音交互系统云平台的NLU模块将接收到的第二响应数据中的文本划分为第二领域文本和第二意图文本;获取第二领域文本和第二意图文本,并对
第一领域文本和第二领域文本进行对比校验,对第一意图文本和第二意图文本进行对比校验;当第一领域文本和第二领域文本相同且第一意图文本和第二意图文本相同时,语音交互设备识别响应检测成功,否则语音交互设备识别响应检测失败。
[0015]进一步地,语音交互设备的检测方法还包括:重复执行多次获取识别响应检测指令之后的步骤;其中,语音播放模块循环播放相同的第一唤醒音频文件,语音播放模块顺序播放不同的技能命令音频文件;记录多次识别响应检测结果,并根据多次识别响应检测结果计算出本轮识别响应检测的识别率。
[0016]进一步地,记录多次识别响应检测结果,并根据多次识别响应检测结果计算出本轮识别响应检测的识别率的方法包括:记录各次识别响应检测为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互设备的检测方法,其特征在于,包括:获取识别响应检测指令;控制语音播放模块播放第一唤醒音频文件;获取语音交互设备根据所述第一唤醒音频文件所生成的第一响应数据;根据所述第一响应数据以及所述语音交互设备的第一响应时长判断所述语音交互设备是否唤醒成功;当所述第一响应数据中包含第一预设信息且所述第一响应时长小于第一预设时长时,所述语音交互设备唤醒成功,否则所述语音交互设备唤醒失败;在所述语音交互设备唤醒成功之后,控制所述语音播放模块播放技能命令音频文件,获取所述语音交互设备发送的根据所述技能命令音频文件所生成的第二响应数据,根据所述第二响应数据以及所述语音交互设备的第二响应时长判断所述语音交互设备识别响应检测是否成功;其中,当所述第二响应数据中包含与所述技能命令音频文件相匹配的第二预设信息且所述第二响应时长小于第二预设时长时,判断所述语音交互设备识别响应检测成功,否则判断所述语音交互设备识别响应检测失败。2.根据权利要求1所述的语音交互设备的检测方法,其特征在于,当进行离线识别响应检测时,所述第二响应数据为所述语音交互设备根据所述技能命令音频文件所生成的。3.根据权利要求1所述的语音交互设备的检测方法,其特征在于,当进行离线识别响应检测时,根据所述第二响应数据以及所述语音交互设备的第二响应时长判断所述语音交互设备识别响应检测是否成功的方法包括:当所述第二响应数据中包含与所述技能命令音频文件相对应的标准文本相同的所述第二预设信息且所述第二响应时长小于第二预设时长时,判断所述语音交互设备识别响应检测成功,否则所述语音交互设备识别响应检测失败。4.根据权利要求1所述的语音交互设备的检测方法,其特征在于,当进行在线识别响应检测时,获取所述语音交互设备发送的根据所述技能命令音频文件所生成的第二响应数据的方法包括:通过所述语音交互设备将所述技能命令音频文件发送给语音交互系统云平台;利用所述语音交互系统云平台根据所述技能命令音频文件生成所述第二响应数据,并将所述第二响应数据发送至所述语音交互设备,以使所述语音交互设备发送所述第二响应数据。5.根据权利要求4所述的语音交互设备的检测方法,其特征在于,利用所述语音交互系统云平台根据所述技能命令音频文件生成所述第二响应数据,并将所述第二响应数据发送至所述语音交互设备的方法包括:通过所述语音交互系统云平台的ASR模块将所述技能命令音频文件转化为文本信息;通过所述语音交互系统云平台的NLU模块对所述文本信息进行语意理解并生成响应文本信息;通过所述语音交互系统云平台的TTS模块将所述响应文本信息转化为响应音频文件;通过所述语音交互系统云平台将所述文本信息、所述响应文本信息和所述响应音频文件均发送给所述语音交互设备;其中,所述第二响应数据包括所述文本信息、所述响应文本信息和所述响应音频文件。
6.根据权利要求1所述的语音交互设备的检测方法,其特征在于,当进行在线识别响应检测时,根据所述第二响应数据以及所述语音交互设备的第二响应时长判断所述语音交互设备识别响应检测是否成功的方法包括:当所述第二响应数据中包含与所述技能命令音频文件相对应的语义准确的第二预设信息且所述第二响应时长小于所述第二预设时长时,所述语音交互设备识别响应检测成功,否则所述语音交互设备识别响应检测失败。7.根据权利要求6所述的语音交互设备的检测方法,其特征在于,所述语音交互设备的检测方法还包括:获取语音指令测试集,并对所述语音指令测试集进行领域类别划分;采用邻近算法对所述语音指令测试集的领域类别划分进行机器学习训练,并获得训练后的领域模型;当进行在线识别响应检测时,所述第二响应数据中包含与所述技能命令音频文件相对应的语义准确的第二预设信息的判定方法包括:根据所述领域模型采用所述邻近算法对所述第二响应数据中的文本进行归类判定,当归类判定正确时,判断所述第二响应数据中包含与所述技能命令音频文件相对应的语义准确的第二预设信息;否则,所述第二响应数据中未包含与所述技能命令音频文件相对应的语义准确的第二预设信息。8.根据权利要求6所述的语音交互设备的检测方法,其特征在于,根据所述第二响应数据以及所述语音交互设备的第二响应时长判断所述语音交互设备识别响应检测是否成功的方法包括:根据所述第二响应数据中的文本以及所述语音交互设备的第二响应时长判断所述语音交互设备识别响应检测是否成功,当所述文本为与所述技能命令音频文件相对应的语义准确的第二预设信息且所述第二响应时长小于所述第二预设时长时,所述语音交互设备识别响应检测成功,否则所述语音交互设备识别响应检测失败;其中,所述文本包括第一领域文本和第一意图文本;所述语音交互设备的检测方法还包括:将所述第二响应数据中的文本发送至语音交互系统云平台进行二次语义理解;通过所述语音交互系统云平台的NLU模块将接收到的所述第二响应数据中的文本划分为第二领域文本和第二意图文本;获取所述第二领域文本和所述第二意...

【专利技术属性】
技术研发人员:刘淼泉陈高陈彦宇马雅奇
申请(专利权)人:珠海联云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1