语音关键词的检测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：34608535 阅读：23 留言：0更新日期：2022-08-20 09:13

本发明专利技术提供一种语音关键词的检测方法、装置、电子设备及可读存储介质，该方法包括：获取待检测的语音片段和目标关键词，所述语音片段为包括多帧语音向量的序列，所述目标关键词为包括多个音节的序列；基于每一个所述音节和所述语音片段，提取每一个所述音节的语音特征，根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度，得到所述目标关键词与所述语音片段之间的相关度矩阵；基于所述相关度矩阵搜索所述目标关键词与所述语音片段间的最佳匹配路径，从而计算所述目标关键词与所述语音片段的匹配概率；若所述匹配概率大于或等于预设阈值，则判定在所述语音片段中包含有所述目标关键词。有所述目标关键词。有所述目标关键词。

全部详细技术资料下载

【技术实现步骤摘要】
语音关键词的检测方法、装置、电子设备及可读存储介质

[0001]本专利技术涉及语音识别
，尤其涉及一种语音关键词的检测方法、装置、电子设备及可读存储介质。

技术介绍

[0002]从语音中检出特定的关键的单词或短语，有广泛的应用场景。例如，在智能家电领域，关键词检出被用于设备语音唤醒和语音命令；在网络直播检查中，关键词检出被用于色情、暴力、侮辱性语言预警；在多媒体资料归档中，关键词检出用于音视频搜索。
[0003]现有的关键词检出方法一般有以下几类：
[0004]第一：大规模连续语音识别法。最直接的办法是利用大规模连续语音识别技术将音频转成文本，再基于文本内容来对关键词进行检测。这种方法的缺陷有两个：(1)大规模连续语音识别对计算资源消耗太大，不适合大规模在线检测，也无法在低计算能力的设备上运行；(2)难以检测词表中没有见过的词。
[0005]第二：部分解码法。通过设计包含关键词和填充成份的小型解码图来实现对关键词的检出。因为解码图是依目标关键词设计的，且规模较小，所以计算量低，可以在嵌入式设备上运行。同时，解码图的设计与生成便捷，因此可以支持任意关键词的检出。这一方法的问题是对不同关键词的路径权重需要重新调节，同时对噪声和混杂声音的抵抗力较低。
[0006]第三：端到端模型法。端到端模型法的基本方案是，给定一个语音片段，基于神经网络直接判断这一语音片段中是否包含某一指定关键词，如果包含则输出1，如果不包含则输出0。这一方法的最大缺陷是网络是特定关键词的，换一个关键词需要重新训练。...

【技术保护点】

【技术特征摘要】
1.一种语音关键词的检测方法，其特征在于，包括：获取待检测的语音片段和目标关键词，所述语音片段为包括多帧语音向量的序列，所述目标关键词为包括多个音节的序列；基于每一个所述音节和所述语音片段，提取每一个所述音节的语音特征，根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度，得到所述目标关键词与所述语音片段之间的相关度矩阵；基于所述相关度矩阵搜索所述目标关键词与所述语音片段间的最佳匹配路径，从而计算所述目标关键词与所述语音片段的匹配概率；若所述匹配概率大于或等于预设阈值，则判定在所述语音片段中包含有所述目标关键词。2.根据权利要求1所述的语音关键词的检测方法，其特征在于，所述基于每一个所述音节和所述语音片段，提取每一个所述音节的语音特征，具体包括：获取每一个所述音节的掩蔽模式；基于每一个所述音节的掩蔽模式，对所述语音片段中的每一帧所述语音向量进行掩码；提取出与每一个所述音节对应的语音特征。3.根据权利要求2所述的语音关键词的检测方法，其特征在于，所述根据每一个所述音节的语音特征和每一个所述音节的基础语音模式计算每一个所述音节与所述语音片段之间的相关度，得到所述目标关键词与所述语音片段之间的相关度矩阵，具体包括：获取每一个所述音节的基础语音模式；将单个所述音节的基础语音模式与单个所述音节和所述语音片段的语音特征间进行点积运算，得到单个所述音节与所述语音片段之间的相关度；计算每一个所述音节与所述语音片段之间的相关度，得到所述目标关键词与所述语音片段之间的相关度矩阵。4.根据权利要求1所述的语音关键词的检测方法，其特征在于，所述计算所述目标关键词与所述语音片段的匹配概率，具体为：根据所述最佳匹配路径计算所述最佳匹配路径的平均匹配分值；根据所述平均匹配分值，获取所述目标关键词与所述语音片段的...

【专利技术属性】
技术研发人员：王东，李蓝天，杜文强，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人