一种关键词检测方法和装置制造方法及图纸

技术编号：10635967 阅读：116 留言：0更新日期：2014-11-12 11:34

本发明专利技术实施方式提出了一种关键词检测方法和装置。方法包括：生成包含语种信息的解码网络，在该解码网络中根据语种信息对关键词进行分组；利用所述解码网络对输入语音进行关键词检测，其中当检测出的关键词之间的语种信息不一致时，对所检测出关键词设置惩罚因子；基于惩罚因子评估所检测出的关键词。本发明专利技术实施方式有效规避了语种识别可能对关键词检测带来的影响，使得在多语种混杂的语音句子中检测关键词成为可能，而且只需要单一的检测引擎就可以完成多语种的关键词检测任务。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术实施方式提出了一种关键词检测方法和装置。方法包括：生成包含语种信息的解码网络，在该解码网络中根据语种信息对关键词进行分组；利用所述解码网络对输入语音进行关键词检测，其中当检测出的关键词之间的语种信息不一致时，对所检测出关键词设置惩罚因子；基于惩罚因子评估所检测出的关键词。本专利技术实施方式有效规避了语种识别可能对关键词检测带来的影响，使得在多语种混杂的语音句子中检测关键词成为可能，而且只需要单一的检测引擎就可以完成多语种的关键词检测任务。【专利说明】一种关键词检测方法和装置
本专利技术实施方式涉及语音处理
，更具体地，涉及一种关键词检测方法和装直。
技术介绍
关键词检测是从语音流中定位给定关键词的起止时间点的过程，其中关键词是能够表达某种实质意义的词语，一般为名词或短语。现有的关键词检测系统框架一般可以分为两类，一类是基于垃圾网络的系统，一类是基于音素或音节识别器的系统。在基于垃圾网络的系统中，解码器的搜索空间由关键词和补白音节组成的网络构成。当一段语音进入网络后，有些部分被识别成关键词，其他部分被识别成补白音节，然后用置信度判决模块对识别出的关键词进行判决，最后输出被接受的关键词及其在语音中的位置信息。在基于音素或音节识别器的系统中，对输入语音进行全文识别，输出音素或音节网络，然后利用文本检索技术在网络中检测给定的关键词。在目前处理多语种关键词检测任务时，通常的做法是把该关键词检测任务分成两个独立的阶段进行。当一段语音被输入后，首先对语音进行语种识别，然后根据语种识别...

【技术保护点】
一种关键词检测方法，其特征在于，该方法包括：生成包含语种信息的解码网络，在该解码网络中根据语种信息对关键词进行分组；利用所述解码网络对输入语音进行关键词检测，其中当检测出的关键词之间的语种信息不一致时，对所检测出关键词设置惩罚因子；基于惩罚因子评估所检测出的关键词。

【技术特征摘要】

【专利技术属性】
技术研发人员：李露，卢鲤，马建雄，孔令挥，饶丰，岳帅，张翔，刘海波，王尔玉，陈波，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人