一种关键词检测方法和装置制造方法及图纸

技术编号:10635967 阅读:116 留言:0更新日期:2014-11-12 11:34
本发明专利技术实施方式提出了一种关键词检测方法和装置。方法包括:生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键词进行分组;利用所述解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子;基于惩罚因子评估所检测出的关键词。本发明专利技术实施方式有效规避了语种识别可能对关键词检测带来的影响,使得在多语种混杂的语音句子中检测关键词成为可能,而且只需要单一的检测引擎就可以完成多语种的关键词检测任务。

【技术实现步骤摘要】
【专利摘要】本专利技术实施方式提出了一种关键词检测方法和装置。方法包括:生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键词进行分组;利用所述解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子;基于惩罚因子评估所检测出的关键词。本专利技术实施方式有效规避了语种识别可能对关键词检测带来的影响,使得在多语种混杂的语音句子中检测关键词成为可能,而且只需要单一的检测引擎就可以完成多语种的关键词检测任务。【专利说明】一种关键词检测方法和装置
本专利技术实施方式涉及语音处理
,更具体地,涉及一种关键词检测方法和 装直。
技术介绍
关键词检测是从语音流中定位给定关键词的起止时间点的过程,其中关键词是能 够表达某种实质意义的词语,一般为名词或短语。现有的关键词检测系统框架一般可以分 为两类,一类是基于垃圾网络的系统,一类是基于音素或音节识别器的系统。 在基于垃圾网络的系统中,解码器的搜索空间由关键词和补白音节组成的网络构 成。当一段语音进入网络后,有些部分被识别成关键词,其他部分被识别成补白音节,然后 用置信度判决模块对识别出的关键词进行判决,最后输出被接受的关键词及其在语音中的 位置信息。在基于音素或音节识别器的系统中,对输入语音进行全文识别,输出音素或音节 网络,然后利用文本检索技术在网络中检测给定的关键词。 在目前处理多语种关键词检测任务时,通常的做法是把该关键词检测任务分成两 个独立的阶段进行。当一段语音被输入后,首先对语音进行语种识别,然后根据语种识别结 果把语音送入与该语种相对应的关键词检测引擎中进行关键词检测,最后把所有结果汇总 起来作为最终的检测结果。 然而,在现有的多语种关键词检测技术中,语种识别的准确率直接会影响到后续 关键词检测的效果。而且,由于语种识别一般需要至少一定长度的音频(如3?5秒),在实 际应用中会对流式关键词检测带来一定的障碍。另外,现有技术的关键词检测技术无法解 决多语种混杂的情况,如"昨晚的演唱会high不high"则无法准确识别语种和关键词。
技术实现思路
本专利技术实施方式提出一种关键词检测方法,以完成多语种的关键词检测任务。 本专利技术实施方式还提出了一种关键词检测方法装置,以完成多语种的关键词检测 任务。 本专利技术实施方式的技术方案如下: -种关键词检测方法,该方法包括: 生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键词进行分 组; 利用所述解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语 种信息不一致时,对所检测出关键词设置惩罚因子; 基于惩罚因子评估所检测出的关键词。 一种关键词检测装置,包括解码网络生成单元、关键词检测单元和关键词评估单 元,其中: 解码网络生成单元,用于生成包含语种信息的解码网络,在该解码网络中根据语 种信息对关键词进行分组; 关键词检测单元,用于利用所述解码网络对输入语音进行关键词检测,其中当检 测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子; 关键词评估单元,用于基于惩罚因子评估所检测出的关键词。 从上述技术方案可以看出,在本专利技术实施方式中,生成包含语种信息的解码网络, 在该解码网络中根据语种信息对关键词进行分组;利用所述解码网络对输入语音进行关 键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚 因子;基于惩罚因子评估所检测出的关键词。由此可见,应用本专利技术实施方式之后,将语种 信息直接构造在解码网络中,利用语种信息对不同语种的关键词进行分组,有效规避了语 种识别可能对关键词检测带来的影响,也使在多语种混杂的语音句子中检测关键词成为可 能。 另外,本专利技术实施方式在解码过程中,通过对语种信息的判断来调整令牌的得分, 并引入了语种转换的惩罚函数,只需要单一的检测引擎就可以完成多语种的关键词检测任 务。 【专利附图】【附图说明】 图1为现有技术中解码网络示意图; 图2为根据本专利技术实施方式关键词检测方法流程图; 图3为根据本专利技术实施方式解码网络示意图; 图4为根据本专利技术实施方式关键词检测装置结构图。 【具体实施方式】 为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步 的详细描述。 图1为现有技术中解码网络示意图。 由图1可见,在现有技术基于垃圾网络的关键词检测系统使用的解码网络中,关 键词和填充音节需要进一步做声学上下文展开,最终的解码空间以HMM状态为图节点。关 键词使用较精细的声学模型描述,一般使用上下文相关的三音子HMM建模,这些模型被成 为前景模型;填充音节代表语音段中的非关键词部分,一般使用较粗的声学模型,如聚类后 的音素语言模型,这些模型被称为背景模型。 然而,在现有的多语种关键词检测技术中,由于语种识别一般需要至少一定长度 的音频(如3?5秒),在实际应用中会对流式关键词检测带来一定的障碍。另外,现有技术 的关键词检测技术无法解决多语种混杂的情况。 在本专利技术实施方式中,基于垃圾网络的框架基础上提出了一种新的关键词检测 方案。在本专利技术实施方式构造解码空间时,直接在解码空间中嵌入语种信息,从而有效规避 了语种识别阶段对流式检测的影响;在本专利技术实施方式的解码过程中,可以利用语种信息 对令牌传递策略进行调整,只需要单一的检测引擎就可以完成多语种的关键词检测任务。 与现有的基于垃圾网络的关键词检测系统相比,本专利技术提出的技术方案主要有两 点改进: (1)多语种解码网络的构造,本专利技术在解码网络中嵌入语种信息; (2)针对多语种解码网络的多语种关键词检测算法。在解码过程中,通过对语种信 息的判断来调整令牌的得分,并引入了语种转换的惩罚函数。 图2为根据本专利技术实施方式关键词检测方法流程图。 如图2所示,该方法包括: 步骤201 :生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键 词进行分组。 在这里,在生成解码网络的过程中,可以初始化开始节点和结束节点,并针对每个 语种信息k执行如下步骤,其中i为语种序号: 构造语种节点Nu,并构造从开始节点到Nu的边; 加载与该语种信息Q对应的关键词列表和填充音节列表; 对所述关键词列表中的每一个关键词I,其中j为关键词序号,执行如下动作: 将关键词Κ」转化成三音子序列,并针对每个三音子构造一个节点以形成节点序 列;依次构造节点序列之间的边;构造语种节点N u到节点序列中第一个节点的边以及节点 序列中最后节点到结束节点的边; 对所述填充音节列表中的每个填充音节Fk,其中k为填充音节序号,执行如下动 作: 构造填充音节Fk对应的节点Na; 构造语种节点Nu到NFk的边和NFk到结束节点的边; 构造从结束节点到开始节点的边; 输出所述解码网络。 步骤202 :利用所述解码网络对输入语音进行关键词检测,其中当检测出的关键 词之间的语种信息不一致时,对所检测出关键词设置惩罚因子。 在一个实施方式中: 在关键词检测的令牌传播过程中,当遇到语种状态本文档来自技高网
...

【技术保护点】
一种关键词检测方法,其特征在于,该方法包括:生成包含语种信息的解码网络,在该解码网络中根据语种信息对关键词进行分组;利用所述解码网络对输入语音进行关键词检测,其中当检测出的关键词之间的语种信息不一致时,对所检测出关键词设置惩罚因子;基于惩罚因子评估所检测出的关键词。

【技术特征摘要】

【专利技术属性】
技术研发人员:李露卢鲤马建雄孔令挥饶丰岳帅张翔刘海波王尔玉陈波
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1