自动外呼系统基于自动分类技术的语音意图判定方法技术方案

技术编号:9465379 阅读:90 留言:0更新日期:2013-12-19 02:58
本发明专利技术公开了一种自动外呼系统基于自动分类技术的语音意图判定方法,应用语音识别技术和自动分类技术建立新的高正确率的科学地通过判定用户语音中所包含意图的方法,实现在语音识别的中间结果——词图网络的基础上完成用户意图分类,保证了意图判定服务在用户语音口音大、噪音大、窄带失真率高、说话不规范的自动外呼应用场景中能够有效进行,使得自动外呼系统能够根据用户意图采取适当的应答策略与用户进行对话,最终实现计算机与用户之间的流畅沟通。

【技术实现步骤摘要】
自动外呼系统基于自动分类技术的语音意图判定系统
本专利技术涉及人机对话领域,特别是涉及一种自动外呼系统基于自动分类技术的语音意图判定方法
技术介绍
外呼系统是呼叫中心常规业务,由坐席主动拨叫用户号码,与用户对话,以完成营销、调查等特定任务。自动外呼系统是指采用计算机替代坐席,用计算机拨叫用户号码并与用户对话,完成特定任务的一种应用系统。在自动外呼系统中,计算机要与用户对话并完成特定任务,其中一个核心技术是语音意图判定,即让计算机在接受到用户语音后,能够通过语音判定用户的意图。语音意图判定是指通过计算机对于用户的语音进行加工处理,判断用户在语音中所表达的意图的处理过程。它是自动外呼系统的重要环节。高性能的语音意图判定方法,能够最大限度地保证人机对话系统能够正确理解用户的意图,并采取相应的应答策略,使得计算机与用户之间的对话过程能够正确且流畅地进行。在传统的语音意图判断任务中,通常包含语音识别、语言分析两个独立的阶段,在第一阶段通过语音识别技术将语音转化为文字,第二阶段通过自然语言处理技术从文字中分析用户意图。语音识别技术是语音意图判定的基础技术,实现从语音到文字的转换。近年来,语音识别技术发展非常迅速,识别能力得到了很大的提高。随着移动互联网的兴起,语音识别技术也逐渐进入了应用市场,成为了移动应用除了文字输入之外的另一个入口。然而,这些应用都局限于用户配合的应用场景,对于用户的语音输入的稳定性和输入质量都有较高要求。而在呼叫中心领域,由于用户语音存在口音大、噪音大、窄带失真率高、用户说话不规范等特点,语音识别的结果一直停留在一个很低的水平,这在很大程度上限制了自动外呼系统的产生。自然语言处理是语音意图判定的关键技术。它能够分析语言文字,识别语言文字中用户希望传递的意图信息。达到这一目的的基础,是语言文字中包含正确的用户意图。在呼叫中心领域,由于语音识别任务的难度原因,使得从语音转换得到的文字中,存在大量的错误,这些错误掩盖了用户的意图,使得后继的自然语言处理过程,往往得不到正确的用户意图。自动分类是一种应用最广泛的模式识别方法,它主要分为分类器训练和分类器应用两部分。在分类器训练阶段,能够提取输入特征和输出类别之间的映射关系,构建分类器。在分类器应用阶段,能够根据新输入的特征,判定目标类别。由于它采用相似度计算进行分类空间建模,因而具有较强的容错性,适用用于输入特征质量不高的应用场景。对于语音识别得到的错误率较高的文字,将其回退到信息量更大的词图网络,同时放弃掉传统自然语言处理分析用户意图的方法,转而采用容错性更强的分类方法进行用户意图判定,是本专利技术的关键创新点。
技术实现思路
本专利技术解决的实际技术问题:为了解决自动外呼系统中语音识别准确性不高而导致的用户意图判定失败问题,本专利技术提供了一种基于自动分类技术的语音意图判定方法,从而更好地保证通过语音判定用户意图的准确性。本专利技术的技术方案:自动外呼系统基于自动分类技术的语音意图判定系统,它包括云端服务器,其与自动外呼系统服务器和结果数据库服务器连接,云端服务器内含有任务调度模块、语音识别模块和意图分类模块;任务调度模块,其作用是提升云端服务器的并发处理能力,通过压力控制和负载均衡,让云端服务器能够同时实现对多路用户语音的意图判定;语音识别模块,接收自动外呼系统服务器传入的语音信息,对输入语音进行降噪、特征提取处理,将输入语音转化为特征序列,然后采用隐马尔科夫连续语音识别器进行语音识别,将语音特征序列转化为带有置信度的词图网络;意图分类模块,接收语音识别模块处理后信息,将词图网络转化为带权重的空间向量,并利用意图分类模块中训练好的意图分类器进行意图自动分类,实现从语音到意图的转化,最后根据意图所对应字符库领域选择出最为正确的文字,形成高准确率的语音识别,并将识别后信息发至自动外呼系统服务器;结果数据库服务器,用于储存云端服务器运行结果;自动外呼系统服务器,采用计算机替代坐席,用计算机拨叫用户号码并与用户对话,完成特定任务。上述的自动外呼系统基于自动分类技术的语音意图判定识别系统,训练意图分类器的具体做法包括以下步骤:a收集并截取大量包含用户意图的语音,人工标注用户语音中所包含的用户意图类别,得到大量带有意图标注的用户语音;b将带有意图标注的用户语音,通过语音识别技术,将每一个用户语音转化为带有置信度的词图网络。c针对词图网络,采用特征选择和特征抽取技术,从词图网络中选择最有代表性的特征,并实现从词图网络到特征向量的映射;d对于从每一个用户语音得到的特征向量,将其与对应的用户意图类别进行关联,并训练两者之间的映射模型,即意图分类器模型。前述的自动外呼系统基于自动分类技术的语音意图判定识别系统,每获取一句用户语音后,意图分类模块会对用户意图进一步细化,为自动外呼系统服务器与用户沟通提供更精准的信息,使沟通更加自然、流畅。前述的自动外呼系统基于自动分类技术的语音意图判定识别系统,用语音识别模块并不产生最终的识别结果,而是用于获取带有置信度的词图网络。与现有技术比较,本专利技术提供的方法有如下有益效果:(1)由于在自动外呼应用中语音识别结果正确率不高,无法在这些含错的文字上面采用自然语言处理技术分析用户意图,使得自动外呼系统难以判定用户意图,最终导致系统与用户之间的对话达成目标。本技术专利技术提出了基于容错率较高的自动分类技术替代自然语言处理技术进行语音意图判定的方法。由于自动分类技术忽略文字间的结构关系,而是采用相似度计算实现用户语音到意图之间的映射,有利于降低错误识别的文字对用户意图的干扰。(2)目前,大多数语音识别的应用,都围绕在通过语音识别获取文字信息后,使用文字信息进行后继的加工处理。这一点在文字信息正确率较高时,由于文字信息传递的用户意图足够正确,使得它比较适用。当文字信息识别率较低时,大量的有用信息在识别过程中被语音识别搜索算法错误丢弃,导致文字信息传递的用户意图也同样丢失在识别过程中。本技术专利技术提出了以语音识别过程中的词图网络替代传统的文字信息作为识别结果,它能够降低语音识别搜索算法对用户意图信息的丢弃概率,使得用户意图信息在语音识别阶段得以最大化的保存。当词图网络结果传递到意图分类模块后,这些保存下来的用户意图信息,将通过意图分类器得到正确的判定。附图说明图1是意图判定服务在云端服务器部署的硬件拓扑示意图;图2是意图判定服务中意图分类模块训练流程图;图3是语音识别产生的词图网络结构示例;图4是意图判定服务应用流程图;图5是本专利技术在自动外呼系统中的实施方式构架框图。具体实施方式为更好地理解本专利技术,下面结合具体实施方式及附图对本专利技术进行更为详细描述。在以下的描述中,当已有的现有技术的详细描述也许会淡化本专利技术的主题内容时,这些描述在这儿将被忽略。附图1是意图判定服务在云端服务器部署的硬件拓扑示意图。本专利技术提供的一种基于自动分类技术的语音意图判定系统,可作为自动外呼系统的核心部件,以意图判定服务的形式,部署在云端服务器上。部署完成后,云端服务器具有根据用户语音判定用户意图的能力:自动外呼系统将用户语音提交给云端服务器,云端服务器调用意图判定服务进行用户意图判定,并将判定得到的用户意图返回给自动外呼系统,同时将相关结果存储到结果数据库系统以作备份。在云端服务器本文档来自技高网
...
自动外呼系统基于自动分类技术的语音意图判定方法

【技术保护点】
一种自动外呼系统基于自动分类技术的语音意图判定方法,其特征在于:它包括云端服务器,其与自动外呼系统服务器和结果数据库服务器连接,云端服务器内含有任务调度模块、语音识别模块和意图分类模块;任务调度模块,其作用是提升云端服务器的并发处理能力,通过压力控制和负载均衡,让云端服务器能够同时实现对多路用户语音的意图判定;语音识别模块,接收自动外呼系统服务器传入的语音信息,对输入语音进行降噪、特征提取处理,将输入语音转化为特征序列,然后采用隐马尔科夫连续语音识别器进行语音识别,将语音特征序列转化为带有置信度的词图网络;意图分类模块,接收语音识别模块处理后信息,将词图网络转化为带权重的空间向量,并利用意图分类模块中训练好的意图分类器进行意图自动分类,实现从语音到意图的转化,最后根据意图所对应字符库领域选择出最为正确的文字,形成高准确率的语音识别,并将识别后信息发至自动外呼系统服务器;?结果数据库服务器,用于储存云端服务器运行结果;自动外呼系统服务器,采用计算机替代坐席,用计算机拨叫用户号码并与用户对话,完成特定任务的一种应用系统。

【技术特征摘要】
1.一种自动外呼系统基于自动分类技术的语音意图判定系统,其特征在于:它包括云端服务器,其与自动外呼系统服务器和结果数据库服务器连接,云端服务器内含有任务调度模块、语音识别模块和意图分类模块;任务调度模块,其作用是提升云端服务器的并发处理能力,通过压力控制和负载均衡,让云端服务器能够同时实现对多路用户语音的意图判定;语音识别模块,接收自动外呼系统服务器传入的语音信息,对输入语音进行降噪、特征提取处理,将输入语音转化为特征序列,然后采用隐马尔科夫连续语音识别器进行语音识别,将语音特征序列转化为带有置信度的词图网络;意图分类模块,接收语音识别模块处理后信息,将词图网络转化为带权重的空间向量,并利用意图分类模块中训练好的意图分类器进行意图自动分类,实现从语音到意图的转化,最后根据意图所对应字符库领域选择出最为正确的文字,形成高准确率的语音识别,并将识别后信息发至自动外呼系统服务器;结果数据库服务器,用于储存云端服务器运行结果;自动外呼系统服务器,采用计算机替代坐席,用计算机拨叫用户号码并与用户对话,完成特定任务。2...

【专利技术属性】
技术研发人员:李建洲杨兴荣
申请(专利权)人:贵阳世纪恒通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1