语音唤醒模型训练方法、装置、设备和语音唤醒方法制造方法及图纸

技术编号：41749383 阅读：29 留言：0更新日期：2024-06-21 21:34

本申请涉及一种语音唤醒模型训练方法、装置、计算机设备和存储介质以及语音唤醒方法、装置、计算机设备和存储介质。语音唤醒模型训练方法包括：获取最小批训练样本内的负样本语句；其中，负样本语句中包括至少一个语音帧；从负样本语句的语音帧之中筛选困难学习语音帧，根据筛选出的困难学习语音帧生成负样本集合；根据最小批训练样本内的待训练正样本的数量从负样本集合中筛选待训练负样本；以及利用待训练正样本和待训练负样本对语音唤醒模型进行训练。采用本方法能够提高语音唤醒模型的输出准确性，进而提高语音唤醒的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音交互，特别是涉及一种语音唤醒模型训练方法、装置、计算机设备和存储介质以及一种语音唤醒方法、装置、计算机设备和存储介质。

技术介绍

1、随着语音交互技术的发展，越来越多的智能设备开始使用语音交互技术，例如，智能汽车，智能手机以及智能音箱等。设备在进入语音交互工作状态的时候，需要先进行语音唤醒操作，语音唤醒技术作为语音交互的入口已然成为各类设备中必不可少的功能。

2、语音唤醒技术到目前已经历了三代更迭。第一代是基于模板匹配的语音唤醒技术，这种技术是先构建模板，遇到语音输入时，将语音输入与模板进行匹配，进而识别语音输入是否为唤醒词，该方法的缺点是唤醒率很低。第二代是基于hmm-gmm(hidden markovmodel-gauss of mixture models，隐马尔可夫模型-混合高斯分布模型)的语音唤醒技术，这种技术是将唤醒任务转换为二分类的识别任务，识别结果为唤醒词和非唤醒词。该方法可以精细建模，唤醒率较第一代技术有所提升，但是仍然不能满足现实的需求。第三代是基于神经网络模型的语音唤醒技术，其中基于端到端...

【技术保护点】

1.一种语音唤醒模型训练方法，所述语音唤醒模型用于对语音交互系统进行唤醒，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述从所述负样本语句的语音帧之中筛选困难学习语音帧，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述负样本语句中的各语音帧的正类别概率的大小筛选困难学习语音帧，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述最小批训练样本内的待训练正样本的数量从所述负样本集合中筛选待训练负样本，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述待训练正样本的数量以及所述正负样本比率从所述...

【技术特征摘要】

1.一种语音唤醒模型训练方法，所述语音唤醒模型用于对语音交互系统进行唤醒，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述从所述负样本语句的语音帧之中筛选困难学习语音帧，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述负样本语句中的各语音帧的正类别概率的大小筛选困难学习语音帧，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述最小批训练样本内的待训练正样本的数量从所述负样本集合中筛选待训练负样本，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述待训练正样本的数量以及所述正负样本比率从所述负样本集合中筛选待训练负样本，包括：

6.根据权利要求1至5任一项所述的方法，其特征在于，所述利用所述待训练正样本和所述待训练负样本对所述语音唤醒模型进行训练，包括：

7.一...

【专利技术属性】
技术研发人员：谭应伟，丁雪枫，
申请(专利权)人：大众问问北京信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人