一种语音词库筛选方法技术

技术编号：7935744 阅读：206 留言：0更新日期：2012-11-01 05:44

本发明专利技术涉及语音词库筛选方法，可有效解决不能满足对语音文件内容和基于关键词信息的内容监测需求的问题，解决的技术方案是，通过构建一个企业电话订货管理的关键词库，应用批量自动语音识别技术、语音文件内容检测技术及分组关键词对比筛选技术，实现对批量电话录音文件基于分组关键词的筛选、自动提取、智能分析，应用语音识别技术通过计算机实现批量语音到文本的转换，应用语音文件内容检测技术通过计算机实现对语音文件中涉及到关键词库中关键词语的语音文件，均通过标记、信息提取、展示的方法将该类文件信息进行过滤，以实现对企业电话订货录音文件中特定或敏感信息的自动捕捉、智能分析展示，本发明专利技术是语音识别技术上的创新。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多人语音自动识别技术、连续语音识别技术、非特定人语音识别技术、语音词库人工智能筛选技术及语音文件内容检测技术等，特别是。
技术介绍
(一)语音识别技术的研究历史及现状在国外，语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统，它是第一个可以识别十个英文数字的语音识别系统。但真正取得实质性进展，并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能，更重要的是语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出，有效的解决了语音信号的特征提取和不等长匹配问题。这一时期的语音识别主要基于模板匹配原理，研究的领域局限在特定人，小词汇表的孤立词识别，实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统；同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。随着应用领域的扩大，小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽，与此同时也带来了许多新的问题第一，词汇表的扩大使得模板的选取和建立发生困难；第二，连续语音中，各个音素、音节以及词之间没有明显的边界，各个发音单位存在受上下文强烈影响的协同发音(Co-articulation)现象；第三，非特定人识别时，不同的人说相同的话相应的声学特征有很大的差异，即使相同的人在不同的时间、生理、心理状态下，说同样内容的话也会有很大的差异；第四，识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。实验室语音识别研究的巨大突破产生于20世纪80年代...

【技术保护点】
一种语音词库筛选方法，其特征在于，包括以下步骤：第一步、关键词库建立及维护，根据企业对电话订货管理的要求，应用Oracle数据库系统建立关键词库及关键词库管理模块，关键词库内容包括针对电话订货服务人员的服务质量、标准用语、服务禁语几大类，每个大类包括若干关键词，每个关键词都包括所在大类、是否被选取、被选取日期、出现次数及与之对应的HMM编号信息；应用JAVA编程技术建立关键词库管理模块，该模块具有关键词的录入、修改、保存、删除、查询及关键词选取、导入、导出的功能，应用该管理模块管理人员能够根据实际需要录入、编辑、删除和选取电话订货服务用语关键词，能够选择用于语音识别筛选的一组关键词；第二步、语音识别系统建模，应用隐马尔可夫模型HMM构建语音识别系统的声学模型，应用隐马尔可夫Trigram模型构建汉语语音识别系统的语言模型，其内容包括以下三个部分：一是基于HMM模型应用向前向后算法解决关键词的评估问题，即为关键词库中的每个关键生成一个对应的HMM，每个观测序列由一个关键词的语音构成，关键词的识别是通过评估进而选出最有可能产生观测序列所代表的读音的HMM而实现；二是基于HMM模型应用Vit...

【技术特征摘要】
1.一种语音词库筛选方法，其特征在于，包括以下步骤第一步、关键词库建立及维护，根据企业对电话订货管理的要求，应用Oracle数据库系统建立关键词库及关键词库管理模块，关键词库内容包括针对电话订货服务人员的服务质量、标准用语、服务禁语几大类，每个大类包括若干关键词，每个关键词都包括所在大类、是否被选取、被选取日期、出现次数及与之对应的HMM编号信息；应用JAVA编程技术建立关键词库管理模块，该模块具有关键词的录入、修改、保存、删除、查询及关键词选取、导入、导出的功能，应用该管理模块管理人员能够根据实际需要录入、编辑、删除和选取电话订货服务用语关键词，能够选择用于语音识别筛选的一组关键词；第二步、语音识别系统建模，应用隐马尔可夫模型HMM构建语音识别系统的声学模型，应用隐马尔可夫Trigram模型构建汉语语音识别系统的语言模型，其内容包括以下三个部分一是基于HMM模型应用向前向后算法解决关键词的评估问题，即为关键词库中的每个关键生成一个对应的HMM，每个观测序列由一个关键词的语音构成，关键词的识别是通过评估进而选出最有可能产生观测序列所代表的读音的HMM而实现；二是基于HMM模型应用Viterbi算法解决语音识别解码问题，即解决一个中文句子如何划分其构成才合适的问题，用隐马尔科夫模型，把中文句子的分词方法看成是隐含状态，而句子则可以看成是给定的可观测状态，从而通过建HMM来寻找出最可能正确的分词方法，解决正确识别汉语单词和连续汉语语句的难题；三是基于HMM模型应用Baum-Welch算法以及Reversed Viterbi算法，解决语音识别过程中的识别速度、准确率、系统自适应、汉语单语语料库收集与整理、模型选择、训练、平滑、压缩问题；第三步、语音识别处理分析，应用JAVA编程技术构建语音识别处理分析模块，该模块具有语音文件导入、关键词导入、关键词对比提取、关键词出现次数计数及保存、特定语音文件导出及与嵌入式非特定人语音识别芯片SR160X的设备相互通信功能，即应用该模块，根据企业考核管理人员从关键词库中选择若干关键词，应用含有嵌入式非特定人语音识别芯片SR160X的设备对指定电话订...

【专利技术属性】
技术研发人员：白晓东，李天印，强锋刚，薛万疆，
申请(专利权)人：河南省烟草公司开封市公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人