关键词检测方法、系统、移动终端及存储介质技术方案

技术编号：24941945 阅读：36 留言：0更新日期：2020-07-17 21:49

本发明专利技术提供了一种关键词检测方法、系统、移动终端及存储介质，该方法包括：获取文本语料和转写文本对语言模型进行模型训练；根据训练集中的声学特征对链模型进行模型训练，将链模型和语言模型进行组合得到语音识别模型；将待检测语音片段输入语音识别模型进行分析得到词图，对词图进行倒排索引；将索引结果转换为因子转换器，将预设关键词输入因子转换器进行检索，得到关键词检索结果；根据关键词检索结果计算预设关键词的出现概率，当出现概率大于概率阈值时，判定预设关键词在待检测语音片段有出现。本发明专利技术通过控制语音识别模型对待检测语音片段进行解码生成词图，规避了因语音识别错误而导致关键词检测错误的情况，提高了关键词检测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
关键词检测方法、系统、移动终端及存储介质
本专利技术属于关键词检测
，尤其涉及一种关键词检测方法、系统、移动终端及存储介质。
技术介绍
关键词检测是从感兴趣的连续语音中检测出关键词的技术，关键词检测在智能家居、电话监听、语音数据挖掘等领域有着重要应用。关键词检测已有超过40年的研究历史，但在低资源、低功耗、低计算复杂度环境下的关键词检测仍然是研究热点。关键词检测从应用场景上可分成两大类，一类是关键词数量较少且固定，从连续语音流中持续检测语音流中是否存在关键词列表中的关键词，典型应用是智能家居中的唤醒词识别；另一类是关键词数量较多且不固定，但是待检测语音是事先存在的，通过算法找出关键词所在的语音片段，典型应用是语音数据挖掘。但现有的关键词检测过程中，主要通过提取大量针对性关键词数据的语音特征，进行归一化后放入神经网络中进行机器学习模型训练，其所得模型鲁棒性较差，在场景不一致的情况下对识别率影响较大，进而降低了关键词检测的准确性。
技术实现思路
本专利技术实施例的目的在于提供一种关键词检测方法、...

【技术保护点】
1.一种关键词检测方法，其特征在于，所述方法包括：/n获取文本语料及训练集中所述文本语料对应的转写文本，并根据所述文本语料和所述转写文本对语言模型进行模型训练；/n根据所述训练集中的声学特征对链模型进行模型训练，并将所述链模型和所述语言模型进行组合，得到语音识别模型；/n将待检测语音片段输入所述语音识别模型进行分析，得到词图，并对所述词图进行倒排索引；/n将索引结果转换为因子转换器，并将关键词表中的预设关键词输入所述因子转换器进行检索，得到关键词检索结果；/n根据所述关键词检索结果分别计算每个所述预设关键词的出现概率，并当所述出现概率大于概率阈值时，则判定对应所述预设关键词在所述待检测语音片段...

【技术特征摘要】
1.一种关键词检测方法，其特征在于，所述方法包括：
获取文本语料及训练集中所述文本语料对应的转写文本，并根据所述文本语料和所述转写文本对语言模型进行模型训练；
根据所述训练集中的声学特征对链模型进行模型训练，并将所述链模型和所述语言模型进行组合，得到语音识别模型；
将待检测语音片段输入所述语音识别模型进行分析，得到词图，并对所述词图进行倒排索引；
将索引结果转换为因子转换器，并将关键词表中的预设关键词输入所述因子转换器进行检索，得到关键词检索结果；
根据所述关键词检索结果分别计算每个所述预设关键词的出现概率，并当所述出现概率大于概率阈值时，则判定对应所述预设关键词在所述待检测语音片段有出现。

2.如权利要求1所述的关键词检测方法，其特征在于，所述根据所述训练集中的声学特征对链模型进行模型训练的步骤包括：
根据所述声学特征训练单音素声学模型，并对所述声学特征进行差分处理，以得到差分特征；
根据所述差分特征对所述训练集进行三音素模型训练，得到三音素声学模型，并根据三音素声学模型对音素进行对齐；
对所述声学特征进行向量变换，得到特征向量，并根据所述特征向量训练所述三音素声学模型；
根据所述三音素声学模型训练所述链模型。

3.如权利要求2所述的关键词检测方法，其特征在于，所述根据所述声学特征训练单音素声学模型的步骤之后，所述方法还包括：
根据所述文本语料和所述转写文本构建发音词典，并控制所述单音素声学模型、所述语言模型和所述发音词典对验证集进行解码，以得到验证解码结果；
根据所述验证解码结果查询模型调整参数，并根据所述模型调整参数对所述单音素声学模型和所述语言模型进行参数更新。

4.如权利要求1所述的关键词检测方法，其特征在于，所述根据所述关键词检索结果分别计算每个所述预设关键词的出现概率所采用的计算公式为：

其中，s为待计算的所述预设关键词关键词，Ntrue(s)为所述预设关键词在所述待检测语音片段中实际出现次数，Ncorrect(s)为所述预设关键词在所述关键词检索结果中对应的计算出现次数，Nspurious(s)为所述预设关键词未在所述待检测语音片段中但判定为在的出现次数，即所述预设关键词的误检次数，T为所述待检测语音片段的总时长，β...

【专利技术属性】
技术研发人员：徐敏，肖龙源，李稀敏，蔡振华，刘晓葳，谭玉坤，
申请(专利权)人：厦门快商通科技股份有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人