语音命令词识别训练方法、装置以及存储介质制造方法及图纸

技术编号:34033874 阅读:55 留言:0更新日期:2022-07-06 11:48
本发明专利技术公开了一种语音命令词识别训练方法、装置以及存储介质。其中,语音命令词识别训练方法,用于实现音频数据中命令词的识别,包括:获取命令词样本集,确定命令词样本集中的多个命令词样本对,其中命令词样本集中的样本为音频信号;利用声学模型对命令词样本对进行特征提取,确定与命令词样本对对应的命令词声学特征对;以及通过度量学习对命令词声学特征对进行特征训练,确定命令词分类器,其中命令词分类器用于对命令词进行分类。词分类器用于对命令词进行分类。词分类器用于对命令词进行分类。

Speech command word recognition training method, device and storage medium

【技术实现步骤摘要】
语音命令词识别训练方法、装置以及存储介质


[0001]本专利技术涉及语音识别
,特别是涉及一种语音命令词识别训练方法、装置以及存储介质。

技术介绍

[0002]语音命令词识别技术是实现人机语音交互的重要技术,其已被广泛地应用于各类智能设备,比如智能音箱、扫地机器人、语音助手、智能声控开关等。语音命令词识别,一般用于智能电子设备硬件上。这些设备会设置特定的命令词,用户可以向智能设备说出预定的命令词,即对智能设备发出指令。在待机状态下,这些智能设备以比较低的功耗持续监听周围的环境,当听到预定的命令词时,就进入工作状态并执行识别到的指令操作。语音命令词识别有两个优化目标:一是需要在尽可能少的误识别率下,获得尽可能高的识别率;二是要尽可能降低功耗。一种比较常用的方法是模板匹配法,该方法是将预先录制的命令词语音和输入语音都转换成特征序列,然后使用DTW等方法在输入语音中寻找与命令词相似的部分。该方法运算量大,太依赖于说话人的原来发音,且不能对样本作动态训练,在复杂环境下识别率相对较低。第二种方法是通过HMM或神经网络建立声学模型,得到发音音素的后验概率,通过解码,搜索概率最大的命令词。该方法需要构建解码图,如果命令词数量较多,构建的解码图将非常庞大,既占用大量内存又增加计算复杂度。第三种方法是端到端的方法,利用神经网络把输入语音转换成固定长度的嵌入向量,然后使用分类器判断命令词类别。该方法省去了繁杂的解码过程,在具有嵌入式神经网络处理器的芯片上运算具有优势,在训练过程中通过后验概率得分和度量损失设置阈值筛选出命令词不同但距离较近的样本对。这些样本对往往就是相似命令词,在实际应用中非常容易产生误识别。
[0003]针对上述的现有技术中存在的现有的端到端的命令词识别方法在遇到相似命令词的情况下,容易发生误识别的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本公开的实施例提供了一种语音命令词识别训练方法、装置以及存储介质,以至少解决现有技术中存在的现有的端到端的命令词识别方法在遇到相似命令词的情况下,容易发生误识别的技术问题。
[0005]根据本公开实施例的一个方面,提供了一种语音命令词识别训练方法,用于实现音频数据中命令词的识别,包括:获取命令词样本集,确定命令词样本集中的多个命令词样本对,其中命令词样本集中的样本为音频信号;利用声学模型对命令词样本对进行特征提取,确定与命令词样本对对应的命令词声学特征对;以及通过度量学习对命令词声学特征对进行特征训练,确定命令词分类器,其中命令词分类器用于对命令词进行分类。
[0006]根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
[0007]根据本公开实施例的另一个方面,还提供了一种语音命令词识别训练装置,用于
实现音频数据中命令词的识别,包括:第一确定模块,用于获取命令词样本集,确定命令词样本集中的多个命令词样本对,其中命令词样本集中的样本为音频信号;第二确定模块,用于利用声学模型对命令词样本对进行特征提取,确定与命令词样本对对应的命令词声学特征对;以及第三确定模块,用于通过度量学习对命令词声学特征对进行特征训练,确定命令词分类器,其中命令词分类器用于对命令词进行分类。
[0008]根据本公开实施例的另一个方面,还提供了一种语音命令词识别训练装置,用于实现音频数据中命令词的识别,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取命令词样本集,确定命令词样本集中的多个命令词样本对,其中命令词样本集中的样本为音频信号;利用声学模型对命令词样本对进行特征提取,确定与命令词样本对对应的命令词声学特征对;以及通过度量学习对命令词声学特征对进行特征训练,确定命令词分类器,其中命令词分类器用于对命令词进行分类。
[0009]在本公开实施例中,本专利技术基于深度度量学习进行端到端的命令词识别训练。训练过程中通过后验概率得分和度量损失设置阈值筛选出命令词不同但距离较近的样本对。这些样本对往往就是相似命令词,在实际应用中非常容易产生误识别。随着训练迭代次数的增加,及时调整筛选阈值和超参数,加大相似命令词在新的度量空间的类间间距,从而降低相似命令词误识别概率。进而解决了现有技术中存在的现有的端到端的命令词识别方法在遇到相似命令词的情况下,容易发生误识别的技术问题。
附图说明
[0010]此处所说明的附图用来提供对本公开的进一步理解,构成本专利技术的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
[0011]图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
[0012]图2是根据本公开实施例1的第一个方面所述的语音命令词识别训练方法的流程示意图;
[0013]图3A是根据本公开实施例1所述的语音命令词识别训练方法的算法结构示意图;
[0014]图3B是根据本公开实施例1所述的声学模型的示意图;
[0015]图3C是根据本公开实施例1所述的深度度量层的示意图;
[0016]图4是根据本公开实施例2所述的语音命令词识别训练装置的示意图;以及
[0017]图5是根据本公开实施例3所述的语音命令词识别训练装置的示意图。
具体实施方式
[0018]为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
[0019]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或
描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0020]实施例1
[0021]根据本实施例,还提供了一种语音命令词识别训练方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0022]本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现语音命令词识别训练方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音命令词识别训练方法,用于实现音频数据中命令词的识别,其特征在于,包括:获取命令词样本集,确定所述命令词样本集中的多个命令词样本对,其中所述命令词样本集中的样本为音频信号;利用声学模型对所述命令词样本对进行特征提取,确定与所述命令词样本对对应的命令词声学特征对;以及通过度量学习对所述命令词声学特征对进行特征训练,确定命令词分类器,其中所述命令词分类器用于对命令词进行分类。2.根据权利要求1所述的方法,其特征在于,利用声学模型对所述命令词样本对进行特征提取,确定与所述命令词样本对对应的命令词声学特征对的操作,包括:通过特征提取算法对所述命令词样本进行音频特征提取,确定命令词音频特征对;以及通过所述声学模型对所述命令词音频特征对进行特征提取,确定所述命令词声学特征对。3.根据权利要求1所述的方法,其特征在于,通过度量学习对所述命令词声学特征对进行特征训练,确定命令词分类器的操作,包括:通过所述度量学习利用预先设置的规则对所述命令词声学特征对进行特征训练,优化所述度量学习的损失函数,确定优化损失函数;以及通过所述优化损失函数对所述命令词声学特征对进行训练,确定所述命令词分类器。4.根据权利要求3所述的方法,其特征在于,所述预先设置的规则为设置所述命令词声学特征对在所述度量学习的度量空间中的距离,所述距离公式如下:学特征对在所述度量学习的度量空间中的距离,所述距离公式如下:并且其中,当x
i
,x
j
是相同的命令词时,l
ij
=1;当x
i
,x
j
是不同的命令词时,l
ij


1。5.根据权利要求3所述的方法,其特征在于,所述优化损失函数的公式如下:其中,M是深度度量层的层数,W和b分别为深度度量层的权重和偏置量,...

【专利技术属性】
技术研发人员:马琳王博欧阳鹏
申请(专利权)人:江苏清微智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1