语种无关的关键词识别方法及系统技术方案

技术编号：9643099 阅读：158 留言：0更新日期：2014-02-07 02:31

本发明专利技术公开了一种语种无关的关键词识别方法及系统，该方法包括：接收待检测语音信号；根据预先构建的解码网络对所述语音信号解码，得到候选关键词；采用不同方式对所述候选关键词进行置信度评价；对不同方式的置信度评价结果进行融合，得到所述候选关键词的有效置信度；根据所述有效置信度确定输出的关键词。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种语种无关的关键词识别方法及系统，该方法包括：接收待检测语音信号；根据预先构建的解码网络对所述语音信号解码，得到候选关键词；采用不同方式对所述候选关键词进行置信度评价；对不同方式的置信度评价结果进行融合，得到所述候选关键词的有效置信度；根据所述有效置信度确定输出的关键词。【专利说明】语种无关的关键词识别方法及系统
本专利技术涉及语音关键词识别
，具体涉及一种语种无关的关键词识别方法及系统。
技术介绍
语音关键词识别是指从给定的语音文件或数据中，判断该语音数据是否包含了某个特定的关键词，以及确定该关键词出现的位置信息等。目前主流的语音关键词识别主要基于语音识别技术，首先采用和该语音语种相关的语音识别器识别出语音所包含的文本内容，随后从所述文本内容中检索特定关键词文本及出现的位置信息等。在这种方法中，用户能够比较方便地定义新的关键词，具有较好的扩展性。然而由于语音识别器的开发训练需要构建相应语种的声学模型和语言模型，因此在向其它语种推广时或因缺乏标注训练数据而无法实施。近年来，公共安全领域对某些小语种或方言语种进行关键词检索的需求日益迫切。考虑到特定语种熟悉人员相对有限，缺乏标注数据，无法快速开发相应语音识别器，进而无法利用传统语音关键词识别系统和方法进行关键词检索。对此，研究人员提出了语种无关关键词识别应用，根据已有标注的关键词发音样本构建关键词模型，快速搭建语音关键词识别系统，灵活方便。目前在语种无关关键词识别中，最常见的是基于DTM (Dynamic Time Warping,动态时间规整)的方法以及基于关...

【技术保护点】
一种语种无关的关键词识别方法，其特征在于，包括：接收待检测语音信号；根据预先构建的解码网络对所述语音信号解码，得到候选关键词；采用不同方式对所述候选关键词进行置信度评价；对不同方式的置信度评价结果进行融合，得到所述候选关键词的有效置信度；根据所述有效置信度确定输出的关键词。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘俊华，魏思，胡国平，胡郁，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人