多音区唤醒测试方法、装置及存储介质制造方法及图纸

技术编号:21037365 阅读:27 留言:0更新日期:2019-05-04 06:46
本发明专利技术实施例提出一种多音区唤醒测试方法、装置及计算机可读存储介质。其中多音区唤醒测试方法包括:记录第一音区的信息,所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区;获取通过播放所述语音测试文件触发唤醒的第二音区的信息;将所述第二音区的信息与所述第一音区的信息相对比;根据对比结果确定唤醒测试结果。本发明专利技术实施例能够针对多音区语音识别的应用场景评估多音区的唤醒效果,得到的唤醒准确度测试结果可用于对多音区算法进行优化,减少了测试的时间损耗,节省了人力成本。

【技术实现步骤摘要】
多音区唤醒测试方法、装置及存储介质
本专利技术涉及信息
,尤其涉及一种多音区唤醒测试方法、装置及计算机可读存储介质。
技术介绍
传统的语音识别技术方案都是围绕一个目标用户进行服务的。例如,传统的车载语音识别技术方案是围绕司机一个人服务的,前端麦克风的角度是对准主驾驶位来设计的。传统的核心垂类导航、音乐、电话等也都是围绕司机来展开设计的。其中,垂类就是垂直领域,特指某个领域,开发者可以根据用户使用场景设定特定领域使得识别结果更准确。比如垂直领域设定为“音乐”,则在语音识别时会优先识别为音乐相关的歌曲名、歌手名或者歌词。多音区语音识别方案可以实现在语音采集环境中全员使用语音服务。仍以车载语音识别为例,车载多音区语音识别方案可以满足车内全员使用车载语音服务。例如,可将全车分为前后左右四个音区,四个音区可以实现独立拾音,且能够自动屏蔽其他音区的声源,全员使用语音服务给车内乘客带来良好的用户体验。在多音区语音识别技术中,评价系统性能的一个重要指标是多音区唤醒的准确度。例如在车载四音区场景中,车内的四个乘客处于一个空间内。虽然四音区采用了隔离度算法实现了四个音区的声音隔离,但车内其中一个乘客的发出的语音可能会误触发到其他音区的唤醒。多音区语音识别的算法在每次调整后,都需要评估通过本次算法的调整是否提高了唤醒的准确度。而唤醒准确度的测试工作量非常大,例如在四音区的场景中需要四个人同时在不同音区所在位置进行测试,需要消耗较多的人力。
技术实现思路
本专利技术实施例提供一种多音区唤醒测试方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种多音区唤醒测试方法,包括:记录第一音区的信息,所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区;获取通过播放所述语音测试文件触发唤醒的第二音区的信息;将所述第二音区的信息与所述第一音区的信息相对比;根据对比结果确定唤醒测试结果。在一种实施方式中,还包括:利用设置于各个音区的语音播放装置播放所述语音测试文件,其中,所述语音播放装置设置于各个音区的指定设置方位,所述指定设置方位包括指定设置高度和/或指定设置方向。在一种实施方式中,获取通过播放所述语音测试文件触发唤醒的第二音区的信息,包括:通过播放所述语音测试文件触发唤醒后,将所述触发唤醒的音区的信息输出到监控日志中;从所述监控日志中获取所述第二音区的信息。在一种实施方式中,根据对比结果确定唤醒测试结果,包括:若所述第二音区的信息与所述第一音区的信息相同,则确定唤醒成功;若所述第二音区的信息与所述第一音区的信息不相同,则确定唤醒失败。在一种实施方式中,根据对比结果确定唤醒测试结果之后,还包括:根据所述语音测试文件分别在各个音区的测试结果,统计多音区唤醒测试的成功率。在一种实施方式中,根据对比结果确定唤醒测试结果之后,还包括:根据多个语音测试文件中的每一个语音测试文件分别在各个音区的测试结果,统计多音区唤醒测试的成功率。在一种实施方式中,根据对比结果确定唤醒测试结果之后,还包括:在所述唤醒测试结果确定为唤醒失败的情况下,记录测试失败信息,所述测试失败信息包括测试使用的所述语音测试文件、所述第二音区的信息和所述第一音区的信息。第二方面,本专利技术实施例提供了一种多音区唤醒测试装置,包括:第一记录单元,用于记录第一音区的信息,所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区;获取单元,用于获取通过播放所述语音测试文件触发唤醒的第二音区的信息;对比单元,用于将所述第二音区的信息与所述第一音区的信息相对比;确定单元,用于根据对比结果确定唤醒测试结果。在一种实施方式中,还包括播放单元,用于:利用设置于各个音区的语音播放装置播放所述语音测试文件,其中,所述语音播放装置设置于各个音区的指定设置方位,所述指定设置方位包括指定设置高度和/或指定设置方向。在一种实施方式中,所述获取单元用于:通过播放所述语音测试文件触发唤醒后,将所述触发唤醒的音区的信息输出到监控日志中;从所述监控日志中获取所述第二音区的信息。在一种实施方式中,所述确定单元用于:若所述第二音区的信息与所述第一音区的信息相同,则确定唤醒成功;若所述第二音区的信息与所述第一音区的信息不相同,则确定唤醒失败。在一种实施方式中,还包括统计单元,用于:根据所述语音测试文件分别在各个音区的测试结果,统计多音区唤醒测试的成功率。在一种实施方式中,还包括统计单元,用于:根据多个语音测试文件中的每一个语音测试文件分别在各个音区的测试结果,统计多音区唤醒测试的成功率。在一种实施方式中,还包括第二记录单元,用于:在所述唤醒测试结果确定为唤醒失败的情况下,记录测试失败信息,所述测试失败信息包括测试使用的所述语音测试文件、所述第二音区的信息和所述第一音区的信息。第三方面,本专利技术实施例提供了一种多音区唤醒测试装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述装置的结构中包括处理器和存储器,所述存储器用于存储支持所述装置执行上述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口,用于与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述第一方面中任一所述的方法。上述技术方案具有如下优点或有益效果:能够针对多音区语音识别的应用场景评估多音区的唤醒效果,得到的唤醒准确度测试结果可用于对多音区算法进行优化,减少了测试的时间损耗,节省了人力成本。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例提供的多音区唤醒测试方法的流程图。图2为本专利技术另一实施例提供的多音区唤醒测试方法的流程图。图3为本专利技术又一实施例提供的多音区唤醒测试方法的流程图。图4为本专利技术实施例提供的多音区唤醒测试装置的结构框图。图5为本专利技术另一实施例提供的多音区唤醒测试装置的结构框图。图6为本专利技术又一实施例提供的多音区唤醒测试装置的结构框图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。图1为本专利技术实施例提供的多音区唤醒测试方法的流程图。如图1所示,本专利技术实施例的多音区唤醒测试方法包括:步骤S110,记录第一音区的信息,所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区;步骤S120,获取通过播放所述语音测试文件触发唤醒的第二音区的信息;步骤S130,将所述第二音区的信息与所述第一音区的信息相对比;步骤S140,根据对比结果确本文档来自技高网...

【技术保护点】
1.一种多音区唤醒测试方法,其特征在于,包括:记录第一音区的信息,所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区;获取通过播放所述语音测试文件触发唤醒的第二音区的信息;将所述第二音区的信息与所述第一音区的信息相对比;根据对比结果确定唤醒测试结果。

【技术特征摘要】
1.一种多音区唤醒测试方法,其特征在于,包括:记录第一音区的信息,所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区;获取通过播放所述语音测试文件触发唤醒的第二音区的信息;将所述第二音区的信息与所述第一音区的信息相对比;根据对比结果确定唤醒测试结果。2.根据权利要求1所述的方法,其特征在于,还包括:利用设置于各个音区的语音播放装置播放所述语音测试文件,其中,所述语音播放装置设置于各个音区的指定设置方位,所述指定设置方位包括指定设置高度和/或指定设置方向。3.根据权利要求1所述的方法,其特征在于,获取通过播放所述语音测试文件触发唤醒的第二音区的信息,包括:通过播放所述语音测试文件触发唤醒后,将所述触发唤醒的音区的信息输出到监控日志中;从所述监控日志中获取所述第二音区的信息。4.根据权利要求1所述的方法,其特征在于,根据对比结果确定唤醒测试结果,包括:若所述第二音区的信息与所述第一音区的信息相同,则确定唤醒成功;若所述第二音区的信息与所述第一音区的信息不相同,则确定唤醒失败。5.根据权利要求1-4中任一项所述的方法,其特征在于,根据对比结果确定唤醒测试结果之后,还包括:根据所述语音测试文件分别在各个音区的测试结果,统计多音区唤醒测试的成功率。6.根据权利要求1-4中任一项所述的方法,其特征在于,根据对比结果确定唤醒测试结果之后,还包括:根据多个语音测试文件中的每一个语音测试文件分别在各个音区的测试结果,统计多音区唤醒测试的成功率。7.根据权利要求4所述的方法,其特征在于,根据对比结果确定唤醒测试结果之后,还包括:在所述唤醒测试结果确定为唤醒失败的情况下,记录测试失败信息,所述测试失败信息包括测试使用的所述语音测试文件、所述第二音区的信息和所述第一音区的信息。8.一种多音区唤醒测试装置,其特征在于,包括:第一记录单元,用于记录第一音区的信息,所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区...

【专利技术属性】
技术研发人员:彭汉迎陈建哲
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1