当前位置: 首页 > 专利查询>清华大学专利>正文

语音关键词的检测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:34608535 阅读:23 留言:0更新日期:2022-08-20 09:13
本发明专利技术提供一种语音关键词的检测方法、装置、电子设备及可读存储介质,该方法包括:获取待检测的语音片段和目标关键词,所述语音片段为包括多帧语音向量的序列,所述目标关键词为包括多个音节的序列;基于每一个所述音节和所述语音片段,提取每一个所述音节的语音特征,根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵;基于所述相关度矩阵搜索所述目标关键词与所述语音片段间的最佳匹配路径,从而计算所述目标关键词与所述语音片段的匹配概率;若所述匹配概率大于或等于预设阈值,则判定在所述语音片段中包含有所述目标关键词。有所述目标关键词。有所述目标关键词。

【技术实现步骤摘要】
语音关键词的检测方法、装置、电子设备及可读存储介质


[0001]本专利技术涉及语音识别
,尤其涉及一种语音关键词的检测方法、装置、电子设备及可读存储介质。

技术介绍

[0002]从语音中检出特定的关键的单词或短语,有广泛的应用场景。例如,在智能家电领域,关键词检出被用于设备语音唤醒和语音命令;在网络直播检查中,关键词检出被用于色情、暴力、侮辱性语言预警;在多媒体资料归档中,关键词检出用于音视频搜索。
[0003]现有的关键词检出方法一般有以下几类:
[0004]第一:大规模连续语音识别法。最直接的办法是利用大规模连续语音识别技术将音频转成文本,再基于文本内容来对关键词进行检测。这种方法的缺陷有两个:(1)大规模连续语音识别对计算资源消耗太大,不适合大规模在线检测,也无法在低计算能力的设备上运行;(2)难以检测词表中没有见过的词。
[0005]第二:部分解码法。通过设计包含关键词和填充成份的小型解码图来实现对关键词的检出。因为解码图是依目标关键词设计的,且规模较小,所以计算量低,可以在嵌入式设备上运行。同时,解码图的设计与生成便捷,因此可以支持任意关键词的检出。这一方法的问题是对不同关键词的路径权重需要重新调节,同时对噪声和混杂声音的抵抗力较低。
[0006]第三:端到端模型法。端到端模型法的基本方案是,给定一个语音片段,基于神经网络直接判断这一语音片段中是否包含某一指定关键词,如果包含则输出1,如果不包含则输出0。这一方法的最大缺陷是网络是特定关键词的,换一个关键词需要重新训练。而且训练每个关键词的网络需要准备大量目标关键词的语音片段,资源消耗太大。

技术实现思路

[0007]本专利技术提供一种语音关键词的检测方法、装置、电子设备及可读存储介质,用以解决现有技术中计算量大、需要重复训练识别目标关键词、对语音片段中的干扰抵抗能力差的缺陷,实现高效、准确地检测目标关键词。
[0008]本专利技术提供一种语音关键词的检测方法,包括:
[0009]获取待检测的语音片段和目标关键词,所述语音片段为包括多帧语音向量的序列,所述目标关键词为包括多个音节的序列;
[0010]基于每一个所述音节和所述语音片段,提取每一个所述音节的语音特征,根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵;
[0011]基于所述相关度矩阵搜索所述目标关键词与所述语音片段间的最佳匹配路径,从而计算所述目标关键词与所述语音片段的匹配概率;
[0012]若所述匹配概率大于或等于预设阈值,则判定在所述语音片段中包含有所述目标关键词。
[0013]根据本专利技术提供的一种语音关键词的检测方法,所述基于每一个所述音节和所述语音片段,提取每一个所述音节的语音特征,具体包括:
[0014]获取每一个所述音节的掩蔽模式;
[0015]基于每一个所述音节的掩蔽模式,对所述语音片段中的每一帧所述语音向量进行掩码;
[0016]提取出与每一个所述音节对应的语音特征。
[0017]根据本专利技术提供的一种语音关键词的检测方法,所述根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵,具体包括:
[0018]获取每一个所述音节的基础语音模式;
[0019]将单个所述音节的基础语音模式与单个所述音节和所述语音片段的语音特征间进行点积运算,得到单个所述音节与所述语音片段之间的相关度;
[0020]计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵。
[0021]根据本专利技术提供的一种语音关键词的检测方法,所述计算所述目标关键词与所述语音片段的匹配概率,具体为:
[0022]根据所述最佳匹配路径计算所述最佳匹配路径的平均匹配分值;
[0023]根据所述平均匹配分值,获取所述目标关键词与所述语音片段的匹配概率。
[0024]根据本专利技术提供的一种语音关键词的检测方法,所述根据所述最佳匹配路径计算所述最佳匹配路径的平均匹配分值,具体包括:
[0025]获取所述最佳匹配路径对应的帧数;
[0026]计算所述最佳匹配路径中每一个音节与每一帧语音向量对应的相关度的累加值;
[0027]所述累加值除以所述帧数,得到所述最佳匹配路径的平均匹配分值。
[0028]根据本专利技术提供的一种语音关键词的检测方法,还包括:
[0029]若所述匹配概率小于所述预设阈值,则判定在所述语音片段中不包括所述目标关键词。
[0030]本专利技术还提供一种语音关键词的检测装置,包括:
[0031]获取模块,用于获取待检测的语音片段和目标关键词,所述语音片段为包括多帧语音向量的序列,所述目标关键词为包括多个音节的序列;
[0032]第一计算模块,用于基于每一个所述音节和所述语音片段,提取每个所述音节的语音特征,根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵;
[0033]第二计算模块,用于基于所述相关度矩阵搜索所述目标关键词与所述语音片段间的最佳匹配路径,从而计算所述目标关键词与所述语音片段的匹配概率;
[0034]结果判定模块,若所述匹配概率大于等于预设阈值,则判定在所述语音片段中包括所述目标关键词。
[0035]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音关键词的
检测方法。
[0036]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音关键词的检测方法。
[0037]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音关键词的检测方法。
[0038]本专利技术提供的语音关键词的检测方法、装置、电子设备及可读存储介质,该检测方法通过以下步骤:获取待检测的语音片段和目标关键词,语音片段为包括多帧语音向量的序列,目标关键词为包括多个音节的序列;
[0039]基于每一个音节和语音片段,提取每个音节的语音特征,根据每一个音节的语音特征和每一个音节的基础语音模式计算每一个音节与语音片段之间的相关度,得到目标关键词与语音片段之间的相关度矩阵;
[0040]基于相关度矩阵搜索目标关键词与语音片段间的最佳匹配路径,从而计算目标关键词与语音片段的匹配概率;
[0041]若匹配概率大于等于预设阈值,则判定在语音片段中包括目标关键词。根据上述步骤从而判断出待检测的语音片段中包括目标关键词,本专利技术所提出的方案学习每个音节的掩码,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音关键词的检测方法,其特征在于,包括:获取待检测的语音片段和目标关键词,所述语音片段为包括多帧语音向量的序列,所述目标关键词为包括多个音节的序列;基于每一个所述音节和所述语音片段,提取每一个所述音节的语音特征,根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵;基于所述相关度矩阵搜索所述目标关键词与所述语音片段间的最佳匹配路径,从而计算所述目标关键词与所述语音片段的匹配概率;若所述匹配概率大于或等于预设阈值,则判定在所述语音片段中包含有所述目标关键词。2.根据权利要求1所述的语音关键词的检测方法,其特征在于,所述基于每一个所述音节和所述语音片段,提取每一个所述音节的语音特征,具体包括:获取每一个所述音节的掩蔽模式;基于每一个所述音节的掩蔽模式,对所述语音片段中的每一帧所述语音向量进行掩码;提取出与每一个所述音节对应的语音特征。3.根据权利要求2所述的语音关键词的检测方法,其特征在于,所述根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵,具体包括:获取每一个所述音节的基础语音模式;将单个所述音节的基础语音模式与单个所述音节和所述语音片段的语音特征间进行点积运算,得到单个所述音节与所述语音片段之间的相关度;计算每一个所述音节与所述语音片段之间的相关度,得到所述目标关键词与所述语音片段之间的相关度矩阵。4.根据权利要求1所述的语音关键词的检测方法,其特征在于,所述计算所述目标关键词与所述语音片段的匹配概率,具体为:根据所述最佳匹配路径计算所述最佳匹配路径的平均匹配分值;根据所述平均匹配分值,获取所述目标关键词与所述语音片段的...

【专利技术属性】
技术研发人员:王东李蓝天杜文强
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1