一种语音识别产品测试方法和测试装置制造方法及图纸

技术编号:20078041 阅读:19 留言:0更新日期:2019-01-15 01:32
本发明专利技术提供了一种语音识别产品测试方法和测试装置,该测试方法包括:获取待测试的语音识别产品所对应语音命令的命令音频文件,并确定至少一个命令播放距离以及命令标准声强范围;针对每一个命令播放距离,在与语音识别产品之间距离等于命令该播放距离的第一目标位置对命令音频文件进行播放,将对命令音频文件进行播放的音量调节至第一目标音量,以使语音识别产品所在位置处语音命令的声强位于命令标准声强范围内,按照第一目标音量在第一目标位置对命令音频文件进行至少一次播放,并获取每一次播放时语音识别产品产生的动作指令;根据语音识别产品对应于各个命令播放距离产生的动作指令确定其语音识别概率。本方案能够提高测试结果的可信度。

A Test Method and Device for Speech Recognition Products

The invention provides a test method and a test device for speech recognition products. The test method includes acquiring command audio files of corresponding voice commands of speech recognition products to be tested, determining at least one command playback distance and command standard sound intensity range, and for each command playback distance, the distance between the voice recognition products and the command playback distance is equal to the command playback distance. The first target position plays the command audio file and adjusts the playing volume of the command audio file to the first target volume so that the sound intensity of the voice command at the location of the speech recognition product is within the standard sound intensity of the command. According to the first target volume, the command audio file is played at least once at the first target location, and each playing time is acquired. The speech recognition product produces action instructions; the speech recognition probability is determined according to the action instructions generated by the speech recognition product corresponding to the playback distance of each command. This scheme can improve the reliability of test results.

【技术实现步骤摘要】
一种语音识别产品测试方法和测试装置
本专利技术涉及产品测试
,特别涉及一种语音识别产品测试方法和测试装置。
技术介绍
语音识别技术也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其本质是将人类语音中的词汇内容转换为计算机可读的输入,被广泛应用于语音拨号、语音导航、室内设备控制等。在开发具有语音识别功能的语音识别产品时,为了保证语音识别产品在相应使用环境中能够正常识别用户发出的语音命令,需要对语音识别产品的语音识别功能进行测试。目前,在对语音识别产品的语音识别功能进行测试时,由人工发出语音命令,根据语音识别产品是否执行与语音命令相对应的操作来判断语音识别产品的语音识别率是否达标。针对目前对语音识别产品的语音识别功能进行测试的方法,在测试过程中由人工发出语音命令,但是不同测试人员所发出语音命令的声调和声强各不相同,即使同一测试人员在不同测试中所发出语音命令的声调和声强也不尽相同,因此测试过程对语音命令没有统一的标准要求,从而导致测试结果的可信度较低。
技术实现思路
本专利技术实施例提供了一种语音识别产品测试方法和测试装置,能够提高测试结果的可信度。第一方面,本专利技术实施例提供了一种语音识别产品测试方法,包括:获取待测试的语音识别产品所对应语音命令的命令音频文件,并确定至少一个命令播放距离以及命令标准声强范围;针对每一个所述命令播放距离均执行:在与所述语音识别产品之间距离等于所述命令播放距离的第一目标位置对所述命令音频文件进行播放;将对所述命令音频文件进行播放的音量调节至第一目标音量,以使所述语音识别产品所在位置处所述语音命令的声强位于所述命令标准声强范围内;按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,并获取每一次播放时所述语音识别产品产生的动作指令;根据所述语音识别产品对应于各个所述命令播放距离产生的所述动作指令,确定所述语音识别产品的语音识别概率。可选地,在所述按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放之前,进一步包括:获取所述语音识别产品对应的噪声音频文件,并确定噪声播放距离、噪声标准声强范围和标准信噪比;在与所述语音识别产品之间距离等于所述噪声播放距离的第二目标位置对所述噪声音频文件进行播放;将对所述噪声音频文件进行播放的音量调节至第二目标音量,以使所述语音识别产品所在位置处所述噪声音频文件所对应噪声的声强位于所述噪声标准声强范围内,且使所述语音命令与所述噪声的信噪比大于所述标准信噪比;所述按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,包括:按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,并在每一次播放所述命令音频文件的同时按照所述第二目标音量在所述第二目标位置对所述噪声音频文件进行播放。可选地,所述根据所述语音识别产品对应于各个所述命令播放距离产生的所述动作指令,确定所述语音识别产品的语音识别概率,包括:将所述语音识别产品对应于各个所述命令播放距离产生的各个所述动作指令上传至服务器;通过所述服务器确定各个所述动作指令中与预设标准动作指令相匹配的所述动作指令的个数,并通过如下公式计算所述语音识别产品的语音识别概率;其中,所述P表征所述语音识别产品的语音识别概率;所述k表征所述命令播放距离的个数;所述li表征第i个所述命令播放距离的值,所述Mi表征在第i个所述命令播放距离对应的所述第一目标位置播放所述命令音频文件的次数;所述mi表征所述语音识别产品对应于第i个所述命令播放距离所产生各个所述动作指令中与所述预设标准动作指令相匹配的所述动作指令的个数。可选地,所述至少一个命令播放距离包括:1m、3m和5m;所述噪声播放距离包括1.5m。可选地,所述命令标准声强范围包括60-70dBA;所述噪声标准声强范围包括0-60dBA;所述标准信噪比包括10dBA。可选地,所述对所述命令音频文件进行播放,包括:通过人工嘴对所述命令音频文件进行播放。可选地,所述对所述命令音频文件进行至少一次播放,包括:通过人工嘴对所述命令音频文件进行至少一次播放。第二方面,本专利技术实施例提供了一种语音识别产品测试装置,包括:预处理单元、命令播放单元和结果处理单元;所述预处理单元,用于获取待测试的语音识别产品所对应语音命令的命令音频文件,并确定至少一个命令播放距离以及命令标准声强范围;所述命令播放单元,用于针对所述预处理单元确定的每一个所述命令播放距离,在与所述语音识别产品之间距离等于所述命令播放距离的第一目标位置对所述命令音频文件进行播放,并将对所述命令音频文件进行播放的音量调节至第一目标音量,以使所述语音识别产品所在位置处所述语音命令的声强位于所述命令标准声强范围内,以及按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,并获取每一次播放时所述语音识别产品产生的动作指令;所述结果处理单元,用于根据所述命令播放单元获取到的所述语音识别产品对应于各个所述命令播放距离产生的所述动作指令,确定所述语音识别产品的语音识别概率。可选地,该语音识别产品测试装置进一步包括:噪声播放单元;所述预处理单元,进一步用于获取所述语音识别产品对应的噪声音频文件,并确定噪声播放距离、噪声标准声强范围和标准信噪比;所述噪声播放单元,用于在与所述语音识别产品之间距离等于所述噪声播放距离的第二目标位置对所述噪声音频文件进行播放,并将对所述噪声音频文件进行播放的音量调节至第二目标音量,以使所述语音识别产品所在位置处所述噪声音频文件所对应噪声的声强位于所述噪声标准声强范围内,且所述语音命令与所述噪声的信噪比大于所述标准信噪比,以及在所述命令播放单元每一次按照所述第一目标音量播放所述命令音频文件的同时按照所述第二目标音量在所述第二目标位置对所述噪声音频文件进行播放。可选地,所述结果处理单元,用于将所述语音识别产品对应于各个所述命令播放距离产生的各个所述动作指令上传至服务器,并通过所述服务器确定各个所述动作指令中与预设标准动作指令相匹配的所述动作指令的个数,以及通过如下公式计算所述语音识别产品的语音识别概率;其中,所述P表征所述语音识别产品的语音识别概率;所述k表征所述命令播放距离的个数;所述li表征第i个所述命令播放距离的值,所述Mi表征在第i个所述命令播放距离对应的所述第一目标位置播放所述命令音频文件的次数;所述mi表征所述语音识别产品对应于第i个所述命令播放距离所产生各个所述动作指令中与所述预设标准动作指令相匹配的所述动作指令的个数。可选地,所述命令播放单元,用于通过人工嘴对所述命令音频文件进行播放。本专利技术实施例提供的语音识别产品测试方法和测试装置,为每一个命令播放距离定义相对应的命令标准声强范围,针对每一个命令播放距离,将对命令音频文件进行播放的音量调节至第一目标音量,使得在与语音识别产品距离等于该命令播放距离的第一目标位置播放音频文件时语音识别产品所在位置处语音命令的声强位于命令标准声强范围内,之后在第一目标位置按照第一目标音量对命令音频文件进行播放并获取语音识别产品产生的动作指令,最后根据语音识别产品对应于各个命令播放距离产生的动作指令来确定其与语音识别概率。在每一个命令播放距离对应的位本文档来自技高网...

【技术保护点】
1.一种语音识别产品测试方法,其特征在于,包括:获取待测试的语音识别产品所对应语音命令的命令音频文件,并确定至少一个命令播放距离以及命令标准声强范围;针对每一个所述命令播放距离均执行:在与所述语音识别产品之间距离等于所述命令播放距离的第一目标位置对所述命令音频文件进行播放;将对所述命令音频文件进行播放的音量调节至第一目标音量,以使所述语音识别产品所在位置处所述语音命令的声强位于所述命令标准声强范围内;按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,并获取每一次播放时所述语音识别产品产生的动作指令;根据所述语音识别产品对应于各个所述命令播放距离产生的所述动作指令,确定所述语音识别产品的语音识别概率。

【技术特征摘要】
1.一种语音识别产品测试方法,其特征在于,包括:获取待测试的语音识别产品所对应语音命令的命令音频文件,并确定至少一个命令播放距离以及命令标准声强范围;针对每一个所述命令播放距离均执行:在与所述语音识别产品之间距离等于所述命令播放距离的第一目标位置对所述命令音频文件进行播放;将对所述命令音频文件进行播放的音量调节至第一目标音量,以使所述语音识别产品所在位置处所述语音命令的声强位于所述命令标准声强范围内;按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,并获取每一次播放时所述语音识别产品产生的动作指令;根据所述语音识别产品对应于各个所述命令播放距离产生的所述动作指令,确定所述语音识别产品的语音识别概率。2.根据权利要求1所述的方法,其特征在于,在所述按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放之前,进一步包括:获取所述语音识别产品对应的噪声音频文件,并确定噪声播放距离、噪声标准声强范围和标准信噪比;在与所述语音识别产品之间距离等于所述噪声播放距离的第二目标位置对所述噪声音频文件进行播放;将对所述噪声音频文件进行播放的音量调节至第二目标音量,以使所述语音识别产品所在位置处所述噪声音频文件所对应噪声的声强位于所述噪声标准声强范围内,且使所述语音命令与所述噪声的信噪比大于所述标准信噪比;所述按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,包括:按照所述第一目标音量在所述第一目标位置对所述命令音频文件进行至少一次播放,并在每一次播放所述命令音频文件的同时按照所述第二目标音量在所述第二目标位置对所述噪声音频文件进行播放。3.根据权利要求1所述的方法,其特征在于,所述根据所述语音识别产品对应于各个所述命令播放距离产生的所述动作指令,确定所述语音识别产品的语音识别概率,包括:将所述语音识别产品对应于各个所述命令播放距离产生的各个所述动作指令上传至服务器;通过所述服务器确定各个所述动作指令中与预设标准动作指令相匹配的所述动作指令的个数,并通过如下公式计算所述语音识别产品的语音识别概率;其中,所述P表征所述语音识别产品的语音识别概率;所述k表征所述命令播放距离的个数;所述li表征第i个所述命令播放距离的值,所述Mi表征在第i个所述命令播放距离对应的所述第一目标位置播放所述命令音频文件的次数;所述mi表征所述语音识别产品对应于第i个所述命令播放距离所产生各个所述动作指令中与所述预设标准动作指令相匹配的所述动作指令的个数。4.根据权利要求2所述的方法,其特征在于,所述至少一个命令播放距离包括:1m、3m和5m;所述噪声播放距离包括1.5m。5.根据权利要求4所述的方法,其特征在于,所述命令标准声强范围包括60-70dBA;所述噪声标准声强范围包括0-60dBA;所述标准信噪比包括10d...

【专利技术属性】
技术研发人员:荣霞芳袁龙刚彭浩
申请(专利权)人:四川虹美智能科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1