一种基于分类规则的语音识别系统及方法技术方案

技术编号：10458810 阅读：111 留言：0更新日期：2014-09-24 14:37

本发明专利技术公开一种基于分类规则的语音识别系统，其特征在于，包括：一语音数据库，该语音数据库用于记录用户语音数据；一语音转换单元，该语音转换单元用于将该用户语音数据转换为一文本，该文本被存储于一文本数据库里，该文本数据库存储该文本与该语音数据间的关联关系以及相关结构化数据；一业务模型数据库，该业务模型数据库用于存储一业务目标与该业务目标所对应的业务解决方案的数据的关联关系；一匹配模块，该匹配模块根据由该业务目标生成的一关键词及该业务模型数据库中预设的一初始关联关系匹配该用户语音与该业务解决方案的数据；一验证模块，该验证模块从该语音数据库中随机提取若干用户语音数据，并判断该匹配模块中预设的初始关联关系的准确性，根据判断结果调整该匹配模块中该关联关系。

全部详细技术资料下载

【技术实现步骤摘要】
-种基于分类规则的语音识别系统及方法
本专利技术基于一种语音识别
，尤其涉及一种根据用户输入的语音信息，基于自定义分类规则的数据建模与分析方法。
技术介绍
呼叫中心存在大量语音数据，整合、分析、利用语音数据成为呼叫中心管理的关键环节，但实际运营中存在以下情况：第一、语音数据不完整，不是所有通话都记录了相应的类别描述，有些甚至完全没有记录。第二、语音数据不严谨，部分类别描述是由坐席手工操作记录下来的，存在敷衍应付和主观出错的情况。第三、对于自定义类别（如专项调查或突击抽查的类别)无法通过系统提前设置和记录。第四、通话过程管理由于缺少有效工具存在管理盲区。针对上述技术问题，现有技术中没有存在一种按照自定义分类规则设定业务模型从而找到数据类别和自动识别的手段，因此难以在此基础上减少人力资源成本的使用。
技术实现思路
本专利技术的目的在于提供按照自定义分类规则设定业务模型从而找到数据类别和自动识别的手段。为了实现上述专利技术目的，本专利技术公开一种基于分类规则的语音识别系统，其特征在于，包括：一语音数据库，该语音数据库用于记录用户语音数据；一语音转换单元，该语音转换单元用于将该用户语音数据转换为一文本，该文本被存储于一文本数据库里，该文本数据库存储该文本与该语音数据间的关联关系；一业务模型数据库，该业务模型数据库用于存储一业务目标与该业务目标所对应的业务解决方案的数据的关联关系；一匹配模块，该匹配模块根据由该业务目标生成的一关键词及该业务模型数据库中预设的一初始关联关系匹配该用...

【技术保护点】
一种基于分类规则的语音识别系统，其特征在于，包括：一语音数据库，所述语音数据库用于记录用户语音数据；一语音转换单元，所述语音转换单元用于将所述用户语音数据转换为一文本，所述文本被存储于一文本数据库里，所述文本数据库存储所述文本与所述语音数据间的关联关系以及相关结构化数据；一业务模型数据库，所述业务模型数据库用于存储一业务目标与所述业务目标所对应的业务解决方案的数据的关联关系；一匹配模块，所述匹配模块根据由所述业务目标生成的一关键词及所述业务模型数据库中预设的一初始关联关系匹配所述用户语音与所述业务解决方案的数据；一验证模块，所述验证模块从所述语音数据库中随机提取若干用户语音数据，并判断所述匹配模块中预设的初始关联关系的准确性，根据判断结果调整所述匹配模块中所述关联关系。

【技术特征摘要】
1. 一种基于分类规则的语音识别系统，其特征在于，包括：一语音数据库，所述语音数据库用于记录用户语音数据；一语音转换单元，所述语音转换单元用于将所述用户语音数据转换为一文本，所述文本被存储于一文本数据库里，所述文本数据库存储所述文本与所述语音数据间的关联关系以及相关结构化数据；一业务模型数据库，所述业务模型数据库用于存储一业务目标与所述业务目标所对应的业务解决方案的数据的关联关系；一匹配模块，所述匹配模块根据由所述业务目标生成的一关键词及所述业务模型数据库中预设的一初始关联关系匹配所述用户语音与所述业务解决方案的数据；一验证模块，所述验证模块从所述语音数据库中随机提取若干用户语音数据，并判断所述匹配模块中预设的初始关联关系的准确性，根据判断结果调整所述匹配模块中所述关联关系。2. 如权利要求1所述的基于分类规则的语音识别系统，其特征在于，所述验证模块反复从所述语音数据库中随机提取若干用户语音数据，并反复判断所述匹配模块中预设的初始关联关系的准确性，根据判断结果重复调整所述匹配模块中所述关联关系，直至使所述用户语音与所述业务解决方案的数据实现一一对应。3. 如权利要求1所述的基于分类规则的语音识别系统，其特征在于，所述匹配模块中的初始关联关系由所述关键词及一经验数据确定。4. 如权利要求1所述的基于分类规则的语音识别系统，其特征在于，所述匹配模块中的初始关联关系至少包括四种逻辑关系。5. 如权利要求4所述的基于分类规则的语音识别系统，其特征在于，所述匹配模块中的初始关联关系包括逻辑与关系、逻辑或关系、逻辑非关系及邻接关系，所述逻辑非关系的优先级高于所述逻辑与关系、逻辑或关系及邻接关系；所述逻辑与关系是指两个关键词必须同时出现在一个用户语音数据的独立片段中，所述逻辑或关系是指只要任意一个关键词出现在先所述用户语音数据的独立片段中，所述逻辑非关系是指关键词不能出现在先所述用户语音数据的独立...

【专利技术属性】
技术研发人员：邵利铎，孙杰平，刘晗，洪大帅，
申请(专利权)人：中国人民财产保险股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人