误唤醒样本数据的获取方法、装置和电子设备制造方法及图纸

技术编号：26691810 阅读：35 留言：0更新日期：2020-12-12 02:44

本申请公开了一种误唤醒样本数据的获取方法、装置和电子设备，涉及语音技术领域。具体实现方案为：先获取由至少一个语音采集部件分别采集的至少一个不包括预设唤醒词的第一语音数据，并将至少一个第一语音数据分别输入到至少一个唤醒引擎，且将至少一个第一语音数据保存到与至少一个唤醒引擎分别对应的至少一个缓存队列中；响应于监听到至少一个唤醒引擎中的至少一个目标唤醒引擎被唤醒，将保存在至少一个目标唤醒引擎对应的至少一个缓存队列中的至少一个第二语音数据确定为误唤醒样本数据，实现了误唤醒样本数据的自动获取，与现有技术中采用人工方式获取误唤醒样本数据相比，有效地提高了误唤醒样本数据的获取效率。

全部详细技术资料下载

【技术实现步骤摘要】
误唤醒样本数据的获取方法、装置和电子设备
本申请涉及数据处理技术中的语音
，尤其涉及一种误唤醒样本数据的获取方法、装置和电子设备。
技术介绍
在驾驶车辆过程中，用户可以通过唤醒引擎，启动车机语音助手。为了减小车机语音助手误唤醒的概率，需要获取各种大量的误触发车机语音助手唤醒的误唤醒样本数据，再采用这些误唤醒样本数据进行引擎训练，从而降低车机语音助手误唤醒的概率。现有技术中，在获取误唤醒样本数据时，是通过外部工具，例如人工嘴、喇叭等随机播放音频，通过车辆中麦克风采集外部工具播放的音频数据，并将采集到的音频数据保存到本地，然后再通过人工的方式从保存的音频数据中挑选出误唤醒样本数据。但是，采用人工方式获取误唤醒样本数据，会导致误唤醒样本数据的获取效率较低。
技术实现思路
本申请实施例提供了一种误唤醒样本数据的获取方法、装置和电子设备，在获取误唤醒样本时，提高了误唤醒样本数据的获取效率。根据本申请的第一方面，提供了一种误唤醒样本数据的获取方法，该误唤醒样本数据的获取方法可以包...

【技术保护点】
1.一种误唤醒样本数据的获取方法，所述方法包括：/n获取由至少一个语音采集部件分别采集的至少一个第一语音数据，所述第一语音数据不包括预设唤醒词；/n将所述至少一个第一语音数据分别输入到至少一个唤醒引擎；/n根据所述至少一个第一语音数据和所述至少一个唤醒引擎的对应关系，将所述至少一个第一语音数据保存到与所述至少一个唤醒引擎分别对应的至少一个缓存队列中；/n响应于监听到所述至少一个唤醒引擎中的至少一个目标唤醒引擎被唤醒，将保存在所述至少一个目标唤醒引擎对应的至少一个缓存队列中的至少一个第二语音数据确定为误唤醒样本数据。/n

【技术特征摘要】
1.一种误唤醒样本数据的获取方法，所述方法包括：
获取由至少一个语音采集部件分别采集的至少一个第一语音数据，所述第一语音数据不包括预设唤醒词；
将所述至少一个第一语音数据分别输入到至少一个唤醒引擎；
根据所述至少一个第一语音数据和所述至少一个唤醒引擎的对应关系，将所述至少一个第一语音数据保存到与所述至少一个唤醒引擎分别对应的至少一个缓存队列中；
响应于监听到所述至少一个唤醒引擎中的至少一个目标唤醒引擎被唤醒，将保存在所述至少一个目标唤醒引擎对应的至少一个缓存队列中的至少一个第二语音数据确定为误唤醒样本数据。

2.根据权利要求1所述的方法，所述响应于监听到所述至少一个唤醒引擎中的至少一个目标唤醒引擎被唤醒，将保存在所述至少一个目标唤醒引擎对应的至少一个缓存队列中的至少一个第二语音数据确定为误唤醒样本数据，包括：
响应于监听到所述至少一个唤醒引擎中的至少一个目标唤醒引擎在第一时刻被唤醒，将所述至少一个目标唤醒引擎对应的至少一个缓存队列中的至少一个第二语音数据中以所述第一时刻为终止时刻的前N秒语音数据确定为误唤醒样本数据；其中，N大于或等于1。

3.根据权利要求2所述的方法，所述将所述至少一个目标唤醒引擎对应的至少一个缓存队列中的至少一个第二语音数据中以所述第一时刻为终止时刻的前N秒语音数据确定为误唤醒样本数据，包括：
分别确定所述至少一个第二语音数据中以所述第一时刻为终止时刻的前N秒数据对应的至少一个误唤醒词；
分别计算所述至少一个误唤醒词对应的误唤醒率；其中，所述误唤醒率用于指示所述误唤醒词在单位时间内的误唤醒频率；
若所述至少一个误唤醒词中，存在目标唤醒词对应的误唤醒率大于或等于预设阈值，则将所述目标唤醒词对应的第二语音数据中的前N秒语音数据确定为所述误唤醒样本数据。

4.根据权利要求1-3任一项所述的方法，所述方法还包括：
采用所述误唤醒样本数据，对唤醒引擎模型进行训练，得到优化后的唤醒引擎模型。

5.根据权利要求1-3任一项所述的方法，所述获取由至少一个语音采集部件分别采集的至少一个第一语音数据之前，还包括：
获取初始第一语音数据；
基于所述预设唤醒词，从所述初始第一语音数据中剔除包括所述预设唤醒词的语音数据，得到所述第一语音数据；
播放所述第一语音数据。

6.根据权利要求2所述的方法，所述方法还包括：
将所述至少一个第二语音数据中以所述第一时刻为终止时刻的前N秒语音数据存储到本地。

7.一种误唤醒样本数据的获取装置，所述装置包括：
获取模块，用于获取由至少一个语音采集部件分...

【专利技术属性】
技术研发人员：周毅，殷切，张龙，左声勇，彭经伟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人