一种语音关键词识别方法、装置、终端及服务器制造方法及图纸

技术编号:16334764 阅读:43 留言:0更新日期:2017-10-03 14:47
本发明专利技术实施例公开了一种语音关键词识别方法、装置、终端及服务器,通过从构成第一语音的第一帧序列中确定第一目标帧;从语音关键词包括的关键字序列中确定目标关键字;在确定目标帧的隐层特征向量与目标关键字对应的关键字模板匹配成功时(关键字模板指示包括目标关键字的第二语音中的第二目标帧的隐层特征向量),若逐一针对关键字序列中的每个关键字对应的关键字模板,均已确定出位于第一语音中的帧的隐层特征向量与其匹配成功,确定第一语音中包括语音关键词的方式,有效实现了对第一语音中的语音关键词的识别。进一步的,便于使用语音唤醒技术的电子设备在识别出第一语音中包括语音关键词时,自动激活与所述语音关键词相应的处理模块。

Method, device, terminal and server for keyword recognition of speech

The embodiment of the invention discloses a speech keyword recognition method, device, terminal and server, which determines the first target frame from the first frame sequence in the first voice; determine the target keywords from the keyword sequence including the speech keyword; in the hidden layer to determine the corresponding feature vector and the target keyword target frame keyword matching is successful when (the hidden layer feature vector template keyword indicates second target frame second voice including the target keywords in the), if the key matrix for each keyword in each sequence in the corresponding, have determined the hidden layer feature vector in the first speech frame matching success, including the first speech keyword in the speech, the effective realization of the voice recognition in the first speech keywords. Further, an electronic device that facilitates the use of voice wakeup techniques automatically activates a processing module corresponding to the speech keyword when a speech key is included in the first speech.

【技术实现步骤摘要】

本专利技术涉及语音识别
,具体涉及一种语音关键词识别方法、装置、终端及服务器
技术介绍
随着科技的发展,语音唤醒技术在电子设备中的应用越来越广泛,其极大程度的方便了用户对电子设备的操作,允许用户与电子设备之间无需手动交互,即可通过语音关键词激活电子设备中相应的处理模块。例如,苹果手机采用关键词“siri”作为激活苹果手机中的语音对话智能助理功能的语音关键词,当苹果手机检测到用户输入包括关键词“siri”的语音时,自动激活苹果手机中的语音对话智能助理功能。有鉴于此,提供一种语音关键词识别方法、装置、终端及服务器,以实现对语音中的语音关键词的识别,对于语音唤醒技术的发展是至关重要的。
技术实现思路
有鉴于此,本专利技术实施例提供一种语音关键词识别方法、装置、终端及服务器,以实现对语音中的语音关键词的识别。为实现上述目的,本专利技术实施例提供如下技术方案:一种语音关键词识别方法,包括:从构成第一语音的第一帧序列中选取一个帧确定为第一目标帧;从语音关键词包括的关键字序列中选取一个关键字确定为目标关键字;确定所述第一目标帧的隐层特征向量是否与所述目标关键字对应的关键字模板匹配成功,所述关本文档来自技高网...
一种语音关键词识别方法、装置、终端及服务器

【技术保护点】
一种语音关键词识别方法,其特征在于,包括:从构成第一语音的第一帧序列中选取一个帧确定为第一目标帧;从语音关键词包括的关键字序列中选取一个关键字确定为目标关键字;确定所述第一目标帧的隐层特征向量是否与所述目标关键字对应的关键字模板匹配成功,所述关键字模板指示包括所述目标关键字的第二语音中的第二目标帧的隐层特征向量;在匹配成功的情况下,若逐一针对关键字序列中的每个关键字对应的关键字模板,均已确定出位于所述第一语音中的帧的隐层特征向量与其匹配成功,确定所述第一语音中包括所述语音关键词。

【技术特征摘要】
1.一种语音关键词识别方法,其特征在于,包括:从构成第一语音的第一帧序列中选取一个帧确定为第一目标帧;从语音关键词包括的关键字序列中选取一个关键字确定为目标关键字;确定所述第一目标帧的隐层特征向量是否与所述目标关键字对应的关键字模板匹配成功,所述关键字模板指示包括所述目标关键字的第二语音中的第二目标帧的隐层特征向量;在匹配成功的情况下,若逐一针对关键字序列中的每个关键字对应的关键字模板,均已确定出位于所述第一语音中的帧的隐层特征向量与其匹配成功,确定所述第一语音中包括所述语音关键词。2.根据权利要求1所述的方法,其特征在于,在匹配失败的情况下,该方法还包括:返回执行“从构成第一语音的第一帧序列中选取一个帧确定为第一目标帧”步骤。3.根据权利要求2所述的方法,其特征在于,所述从构成第一语音的第一帧序列中选取一个帧确定为第一目标帧,包括:确定构成第一语音的第一帧序列中的、第一个从未被确定为第一目标帧的帧;将所确定的帧,作为从构成所述第一语音的第一帧序列中确定的第一目标帧。4.根据权利要求3所述的方法,其特征在于,所述从语音关键词包括的关键字序列中选取一个关键字确定为目标关键字,包括:确定语音关键词包括的关键字序列中的,与最近一次匹配成功的关键字模板对应的关键字相邻的下一关键字;若所述下一关键字被连续确定为目标关键字的次数未达到预设的阈值,将所述下一关键字确定为目标关键字;若所述下一关键字被连续确定为目标关键字的次数达到所述阈值,将所述关键字序列中的第一个关键字确定为目标关键字。5.根据权利要求2所述的方法,其特征在于,所述关键字模板的生成过程包括:确定包括所述目标关键字的第二语音,所述第二语音由第二帧序列构成;将所述第二语音作为预设的语音模型的输入信息,确定分别与所述第二帧序列中的每个帧对应的终层特征向量;基于分别与每个帧对应的终层特征向量,从所述第二帧序列中确定第二目标帧;根据将所述第二目标帧作为所述语音模型的输入信息所得到的与所述第二目标帧对应的隐层特征向量,生成与所述目标关键字对应的关键字模板。6.根据权利要求5所述的方法,其特征在于,所述帧对应的终层特征向量,包括:所述帧分别与所述语音模型中预设的文字集中的每个文字之间的相似度,所述目标关键字为所述文件集中的一个文字;所述基于分别与每个帧对应的终层特征向量,从所述第二帧序列中确定第二目标帧,包括:基于分别与每个帧对应的终层特征向量,从所述第二帧序列中选取与所述目标关键字的相似程度最高的帧作为第二目标帧;其中,帧与所述目标关键字的相似程度根据所述帧分别与所述文字集中的每个文字之间的相似度确定。7.根据权利要求6所述的方法,其特征在于,所述基于分别与每个帧对应的终层特征向量,从所述第二帧序列中选取与所述目标关键字的相似程度最高的帧作为第二目标帧,包括:从所述第二帧序列中确定至少一个第一候选帧,所述第一候选帧与所述目标关键字的相似度小于所述第一候选帧与所述文字集中的至少一个文字的相似度,所述至少一个文字的个数小于预设数值;从所述至少一个第一候选帧中确定至少一个第二候选帧,所述至少一个第二候选帧为所述至少一个第一候选帧中与所述目标关键字的相似度最大的各第一候选帧;从所述至少一个第二候选帧中确定第二目标帧,按照相似度从高到低的顺序,所述第二目标帧与所述目标关键字的相似度位于所述第二目标帧与各文字的相似度中的排名,高于除所述第二目标帧外的每个所述第二候选帧与所述目标关键字的相似度位于所述第二候选帧与各文字的相似度中的排名。8.一种语音关键词识别装置,其特征在于,包括:第一目标帧确定单元,用于从构成第一语音的第一帧序列中选取一个帧确定为第一目标帧;目标关键字确定单元,用于从语音关键词包括的关键字序列中选取一个关键字确定为目标关键字;匹配单元,用于确定所述第一目标帧的隐层特征向量是否与所述目标关键字对应的关键字模板匹配成功,所述关键字模板指示包括所述目标关键字的第二语音中的第二目标帧的隐层特征向量;识别单元,用于在匹配成功的情况下,若逐一针对关键字序列中的每个关键字对应的关键字模板,均已确定出位于所述第一语音中的帧的隐层特征向量与其匹配成功,确定所述第一语音中包括所述语音关键词。9.根据权利要求8所述的装置,其特征在于,还包括:返回执行单元,用于:在匹配失败的情况...

【专利技术属性】
技术研发人员:王珺黄志恒于蒙蒲松柏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1