一种基于分类规则的语音识别系统及方法技术方案

技术编号:10458810 阅读:111 留言:0更新日期:2014-09-24 14:37
本发明专利技术公开一种基于分类规则的语音识别系统,其特征在于,包括:一语音数据库,该语音数据库用于记录用户语音数据;一语音转换单元,该语音转换单元用于将该用户语音数据转换为一文本,该文本被存储于一文本数据库里,该文本数据库存储该文本与该语音数据间的关联关系以及相关结构化数据;一业务模型数据库,该业务模型数据库用于存储一业务目标与该业务目标所对应的业务解决方案的数据的关联关系;一匹配模块,该匹配模块根据由该业务目标生成的一关键词及该业务模型数据库中预设的一初始关联关系匹配该用户语音与该业务解决方案的数据;一验证模块,该验证模块从该语音数据库中随机提取若干用户语音数据,并判断该匹配模块中预设的初始关联关系的准确性,根据判断结果调整该匹配模块中该关联关系。

【技术实现步骤摘要】
-种基于分类规则的语音识别系统及方法
本专利技术基于一种语音识别
,尤其涉及一种根据用户输入的语音信息,基 于自定义分类规则的数据建模与分析方法。
技术介绍
呼叫中心存在大量语音数据,整合、分析、利用语音数据成为呼叫中心管理的关键 环节,但实际运营中存在以下情况:第一、语音数据不完整,不是所有通话都记录了相应的 类别描述,有些甚至完全没有记录。第二、语音数据不严谨,部分类别描述是由坐席手工操 作记录下来的,存在敷衍应付和主观出错的情况。第三、对于自定义类别(如专项调查或突 击抽查的类别)无法通过系统提前设置和记录。第四、通话过程管理由于缺少有效工具存在 管理盲区。 针对上述技术问题,现有技术中没有存在一种按照自定义分类规则设定业务模型 从而找到数据类别和自动识别的手段,因此难以在此基础上减少人力资源成本的使用。
技术实现思路
本专利技术的目的在于提供按照自定义分类规则设定业务模型从而找到数据类别和 自动识别的手段。 为了实现上述专利技术目的,本专利技术公开一种基于分类规则的语音识别系统,其特征 在于,包括:一语音数据库,该语音数据库用于记录用户语音数据;一语音转换单元,该语 音转换单元用于将该用户语音数据转换为一文本,该文本被存储于一文本数据库里,该文 本数据库存储该文本与该语音数据间的关联关系;一业务模型数据库,该业务模型数据库 用于存储一业务目标与该业务目标所对应的业务解决方案的数据的关联关系;一匹配模 块,该匹配模块根据由该业务目标生成的一关键词及该业务模型数据库中预设的一初始关 联关系匹配该用户语音与该业务解决方案的数据;一验证模块,该验证模块从该语音数据 库中随机提取若干用户语音数据,并判断该匹配模块中预设的初始关联关系的准确性,根 据判断结果调整该匹配模块中该关联关系。 更进一步地,该验证模块反复从该语音数据库中随机提取若干用户语音数据,并 反复判断该匹配模块中预设的初始关联关系的准确性,根据判断结果重复调整该匹配模块 中该关联关系,直至使该用户语音与该业务解决方案的数据实现一一对应。 更进一步地,该匹配模块中的初始关联关系由该关键词及一经验数据确定。 更进一步地,该匹配模块中的初始关联关系至少包括四种逻辑关系。 更进一步地,该匹配模块中的初始关联关系包括逻辑与关系、逻辑或关系、逻辑非 关系及邻接关系,该逻辑非关系的优先级高于该逻辑与关系、逻辑或关系及邻接关系;该逻 辑与关系是指两个关键词必须同时出现在一个用户语音数据的独立片段中,该逻辑或关系 是指只要任意一个关键词出现在先该用户语音数据的独立片段中,该逻辑非关系是指关键 词不能出现在先该用户语音数据的独立片段中,该邻接关系是指两个关键词必须同时存在 且具有前后顺序及满足一定距离关系。 本专利技术同时公开一种基于分类规则的语音识别方法,其特征在于,包括:步骤一、 记录用户语音数据于一语音数据库中;步骤二、将该用户语音数据转换为一文本,并将该文 本与该语音数据间的关联关系存储一文本数据库中;步骤三、在一业务模型数据库中记录 一业务目标与该业务目标所对应的业务解决方案的数据的关联关系;步骤四、根据该业务 目标生成的一关键词及预设的一初始关联关系匹配该用户语音与该业务解决方案的数据; 步骤五、从该语音数据库中随机提取若干用户语音数据,并判断该步骤四中预设的初始关 联关系的准确性,根据判断结果调整该步骤四中该关联关系。 更进一步地,该步骤五还包括:重复从该语音数据库中随机提取若干用户语音数 据,并多次判断该步骤四中预设的初始关联关系的准确性,根据判断结果重复调整该步骤 四中该关联关系,直至使该用户语音与该业务解决方案的数据实现一一对应。 更进一步地,该步骤四中预设的初始关联关系由该关键词及一经验数据确定。 更进一步地,该步骤四中预设的初始关联关系至少包括四种逻辑关系。 更进一步地,该初始关联关系包括逻辑与关系、逻辑或关系、逻辑非关系及邻接关 系,该逻辑非关系的优先级高于该逻辑与关系、逻辑或关系及邻接关系;该逻辑与关系是指 两个关键词必须同时出现在一个用户语音数据的独立片段中,该逻辑或关系是指只要任意 一个关键词出现在先该用户语音数据的独立片段中,该逻辑非关系是指关键词不能出现在 先该用户语音数据的独立片段中,该邻接关系是指两个关键词必须同时存在且具有前后顺 序及满足一定距离关系。 与现有技术相比较,本系统通过从语音数据库中随机地反复地抽取数据,验证原 始分类规则的合理性,并根据验证结果自动修改分类规则,利用不同的数据库可以实现业 务营销的效果分析、质量管理和监督、销售技能分析、客户行为分析、自动语音应答等后续 操作。 【附图说明】 关于本专利技术的优点与精神可以通过以下的专利技术详述及所附图式得到进一步的了 解。 图1是本专利技术所提供的基于分类规则的语音识别方法的流程图。 图2是本专利技术所提供的基于分类规则的语音识别系统的结构示意图。 【具体实施方式】 下面结合附图详细说明本专利技术的具体实施例。 图1是本专利技术所提供的基于分类规则的语音识别方法的流程图。本专利技术的目的在 于提供一种自动的基于分类规则的语音识别系统及方法,该语音识别系统根据用户的语音 数据不断调整分类规则,从而减少了人工操作的步骤,并根据分类规则不断修订和完善的 结果实现用户输入的语音数据与业务解决方案的数据之间的一一匹配。 以下将结合图1和图2介绍本专利技术。如图1所示,用户呼叫语音均被统一存储与语 音数据库101中,通过转换102,将所述用户语音数据转换为一文本,文本被存储于一文本 数据库103里,文本数据库用于存储所述文本与所述语音数据间的关联关系。该语音识别 系统还包括业务模型数据库105,业务模型数据库用于存储一业务目标106与业务目标106 所对应的业务解决方案的数据的关联关系及相关结构化数据;匹配模块,匹配模块根据由 所述业务目标生成的一关键词及所述业务模型数据库中预设的一初始分类规则104匹配 文本数据集107,最终匹配所述用户语音与语音集108。 从应用实现上来看,本专利技术所提供的基于分类规则的语音识别系统,可以纵向被 划分为应用层200,实现层300以及数据层400。其中,应用层200包括业务目标201、应用 场景202和页面展现203。实现层300包括语音转换单元301、业务模型模块302、分类规则 模块303、匹配模块304以及验证模块305。该数据层400包括语音数据库401、文本数据库 402以及业务数据库403。 本系统的具体流程如下:第一步,建立语音数据库,编写相关工具结构化语音数 据并建立文本数据库,记录文本与语音数据间的关联关系。 这一步工具转换的准确率非常重要,直接关系到后续模型建立的效果。文本与语 音数据的关联关系,是为了保证从模型输出结果中反查调取相应的语音数据进行验证及相 关后续工作。 第二步,按照业务目标建立业务模型,即建立的业务模型是为了满足某个业 务目标或拟解决的业务问题。如营销活动过程及效果监测模型是为了检验和检测某次营销 活动的执行过程和效果。 这一步与实际生产密切相关,业务模型,源自呼叫中心实际运营管理中遇到的困 本文档来自技高网...

【技术保护点】
一种基于分类规则的语音识别系统,其特征在于,包括:一语音数据库,所述语音数据库用于记录用户语音数据;一语音转换单元,所述语音转换单元用于将所述用户语音数据转换为一文本,所述文本被存储于一文本数据库里,所述文本数据库存储所述文本与所述语音数据间的关联关系以及相关结构化数据;一业务模型数据库,所述业务模型数据库用于存储一业务目标与所述业务目标所对应的业务解决方案的数据的关联关系;一匹配模块,所述匹配模块根据由所述业务目标生成的一关键词及所述业务模型数据库中预设的一初始关联关系匹配所述用户语音与所述业务解决方案的数据;一验证模块,所述验证模块从所述语音数据库中随机提取若干用户语音数据,并判断所述匹配模块中预设的初始关联关系的准确性,根据判断结果调整所述匹配模块中所述关联关系。

【技术特征摘要】
1. 一种基于分类规则的语音识别系统,其特征在于,包括: 一语音数据库,所述语音数据库用于记录用户语音数据; 一语音转换单元,所述语音转换单元用于将所述用户语音数据转换为一文本,所述文 本被存储于一文本数据库里,所述文本数据库存储所述文本与所述语音数据间的关联关系 以及相关结构化数据; 一业务模型数据库,所述业务模型数据库用于存储一业务目标与所述业务目标所对应 的业务解决方案的数据的关联关系; 一匹配模块,所述匹配模块根据由所述业务目标生成的一关键词及所述业务模型数据 库中预设的一初始关联关系匹配所述用户语音与所述业务解决方案的数据; 一验证模块,所述验证模块从所述语音数据库中随机提取若干用户语音数据,并判断 所述匹配模块中预设的初始关联关系的准确性,根据判断结果调整所述匹配模块中所述关 联关系。2. 如权利要求1所述的基于分类规则的语音识别系统,其特征在于,所述验证模块反 复从所述语音数据库中随机提取若干用户语音数据,并反复判断所述匹配模块中预设的初 始关联关系的准确性,根据判断结果重复调整所述匹配模块中所述关联关系,直至使所述 用户语音与所述业务解决方案的数据实现一一对应。3. 如权利要求1所述的基于分类规则的语音识别系统,其特征在于,所述匹配模块中 的初始关联关系由所述关键词及一经验数据确定。4. 如权利要求1所述的基于分类规则的语音识别系统,其特征在于,所述匹配模块中 的初始关联关系至少包括四种逻辑关系。5. 如权利要求4所述的基于分类规则的语音识别系统,其特征在于,所述匹配模块中 的初始关联关系包括逻辑与关系、逻辑或关系、逻辑非关系及邻接关系,所述逻辑非关系的 优先级高于所述逻辑与关系、逻辑或关系及邻接关系;所述逻辑与关系是指两个关键词必 须同时出现在一个用户语音数据的独立片段中,所述逻辑或关系是指只要任意一个关键词 出现在先所述用户语音数据的独立片段中,所述逻辑非关系是指关键词不能出现在先所述 用户语音数据的独立...

【专利技术属性】
技术研发人员:邵利铎孙杰平刘晗洪大帅
申请(专利权)人:中国人民财产保险股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1