一种提供自动语音识别统一开发平台的系统和方法技术方案

技术编号:3496309 阅读:254 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种提供自动语音识别统一开发平台的系统和方法,所述方法包括以下步骤:A1.用户调用客户端的自动语音识别接口;A2.所述客户端发送自动语音识别的语法信息到服务器端;A3.所述服务器端解析所述语法信息,判断所述语法信息正确,执行步骤A4,否则不再执行后续步骤;A4.所述服务器端向所述客户端返回开始识别语音数据的请求;A5.所述客户端连接到所述服务器端,并发送用户的语音数据;A6.所述服务器端进行自动语音识别,将识别结果返回到所述客户端;A7.所述客户端向用户返回所述识别结果。从而为各运营商统一建立一套ASR资源平台,各SP可以按需使用,SP在此基础上可以很方便的在业务中集成ASR功能。

【技术实现步骤摘要】

本专利技术涉及电信增值业务的自动语音识别应用,尤其涉及的是,。
技术介绍
ASR(Auto Speech Recognize,自动语音识别)为根据事先定义的语法规则,对用户说话的内容进行识别,并输出识别结果,免去按键的烦恼;即使用语法信息的形式来识别用户的回答。系统可以根据识别的结果再结合ASR应用与用户进行交互完成比较复杂的业务。如语音电话本、自动声讯台等应用都有ASR的应用案例。随着电信、联通、移动和网通等各大运营商增值业务的发展,大多数的业务都由SP(Service Provider,业务提供商)来完成,在SP提供的业务中,ASR资源的使用越来越广泛。目前大多的SP业务开发能力很强,但对于ASR资源的集成则比较困难,且识别服务器品牌也比较多。目前,各厂商的ASR主要由客户端和服务器两个模块组成。不同的厂商使用自定义接口,所以,对于SP来说必须针对不同厂商进行不同的开发,对于SP来说开发难度较大。如果各个SP都建设自己的ASR资源平台,还存在资源的浪费、使用不均衡问题,同时,SP各建一套对于运营商在管理上也会带来问题,无法对SP有效的监管。因此,现有技术存在缺陷,需要改进。
技术实现思路
本专利技术的目的在于提供,用户可以统一使用ASR资源平台。本专利技术的技术方案如下一种提供自动语音识别统一开发平台的方法,包括以下步骤A1、用户调用客户端的自动语音识别接口;A2、所述客户端发送自动语音识别的语法信息到服务器端;A3、所述服务器端解析所述语法信息,判断所述语法信息正确,执行步骤A4,否则不再执行后续步骤;A4、所述服务器端向所述客户端返回开始识别语音数据的请求;A5、所述客户端连接到所述服务器端,并发送用户的语音数据;A6、所述服务器端进行自动语音识别,将识别结果返回到所述客户端;A7、所述客户端向用户返回所述识别结果。所述的方法,其中,所述步骤A2具体包括B1、所述客户端连接到代理服务器端、初始化用户参数;B2、所述客户端通过所述代理服务器端,发送自动语音识别的语法信息到服务器端;并且,所述步骤A4具体包括所述服务器端通过所述代理服务器端,向所述客户端返回开始识别语音数据的请求。所述的方法,其中,所述步骤B2之前还包括步骤所述客户端向所述代理服务器端发送鉴权请求,鉴权成功则继续执行步骤B2,否则不再执行后续步骤。所述的方法,其中,所述步骤A6具体包括所述服务器端进行自动语音识别后,将识别结果通过所述代理服务器端,返回到所述客户端。所述的方法,其中,所述步骤A6还包括所述代理服务器端根据所述识别结果进行计费。一种提供自动语音识别统一开发平台的系统,其中,包括客户端模块和服务器端模块;所述客户端模块包括数据发送单元和识别单元;其中,所述数据发送单元用于接受所述识别单元的控制、向所述服务器端模块发送语音数据,所述识别单元还用于为用户提供自动语音识别转换接口;所述服务器端模块用于实现用户的自动语音识别功能。所述的系统,其中,其还包括代理服务器模块;同时,所述客户端模块还包括初始化单元,用于初始化用户参数、建立与所述代理服务器模块的连接,所述识别单元还用于向所述代理服务器模块发起自动语音识别请求和交互;所述代理服务器模块包括主控单元和协议处理单元,所述主控单元用于实现所述协议处理单元、所述客户端模块和所述服务器端模块之间的信息转发,所述协议处理单元用于处理所述自动语音识别请求、并与所述服务器端模块交互自动语音识别信息;并且,所述识别单元还用于根据确定的所述自动语音识别信息,控制所述数据发送单元向所述服务器端模块发送语音数据。所述的系统,其中,所述代理服务器模块还包括与所述主控单元相交互的鉴权单元,用于认证用户是否具备自动语音识别服务权限;所述识别单元还用于携带用户的鉴权请求;所述主控单元还用于将所述鉴权请求信息发送给所述鉴权单元,得到鉴权结果,并返回给所述识别单元。所述的系统,其中,所述代理服务器模块还包括与所述主控单元相连接的计费单元,用于对自动语音识别过程进行计费。所述的系统,其中,所述代理服务器模块分别和所述客户端模块、所述服务器模块通过TCP/IP协议连接,所述客户端模块和所述服务器模块通过TCP/IP协议通讯。采用上述方案,本专利技术为各运营商统一建立一套ASR资源平台,各SP可以按需使用,SP在此基础上可以很方便的在业务中集成ASR功能,同时ASR资源统一调配使用,大大提高资源的利用率,运营商可以对SP使用ASR资源计费,这种资源平台建设模式既减少了总体投入成本,又促进了增值业务发展,可以真正实现了SP和运营商的双赢。可广泛应用于电信、移动、联通的基于语音的业务范畴,完成各种语音识别的相关业务,如语音电话本、自动声讯台等,可以提高运营商资源的利用率和系统安全性。本专利技术采用了分层架构,整个系统可扩展性强,ASR客户端模块、代理服务器模块和ASR服务器模块均可根据容量进行扩容,同时还具备了容量大的特点。附图说明图1为本专利技术系统的ASR统一开发平台原理示意图;图2为本专利技术系统的ASR统一开发平台结构示意图;图3为本专利技术方法的ASR统一开发平台系统ASR识别处理流程图;图4为本专利技术系统的ASR统一开发平台具体实施示意图;图5为本专利技术方法的流程图。具体实施例方式本专利技术提供了ASR平台系统及方法,可以向第三方提供统一的ASR开发接口,实现ASR功能,并对第三方进行计费。以下对本专利技术的较佳实施例加以详细说明。如图5所示,本专利技术提供了一种提供自动语音识别统一开发平台的方法,包括以下步骤。A1、用户调用客户端的自动语音识别接口;A2、所述客户端发送自动语音识别的语法信息到服务器端;A3、所述服务器端解析所述语法信息,判断所述语法信息正确,执行步骤A4,否则不再执行后续步骤;A4、所述服务器端向所述客户端返回开始识别语音数据的请求;A5、所述客户端连接到所述服务器端,并发送用户的语音数据;A6、所述服务器端进行自动语音识别,将识别结果返回到所述客户端;A7、所述客户端向用户返回所述识别结果。在具体实施中,一种实施方式是,所述步骤A2可以具体包括 B1、所述客户端连接到代理服务器端、初始化用户参数;所述用户参数可以包括用户名、密码、IP地址等等;B2、所述客户端通过所述代理服务器端,发送自动语音识别的语法信息到服务器端。并且,所述步骤A4具体包括所述服务器端通过所述代理服务器端,向所述客户端返回开始识别语音数据的请求。此时,具体实施中,在所述步骤B2之前还可以包括鉴权步骤所述客户端向所述代理服务器端发送鉴权请求,鉴权成功则继续执行步骤B2,否则不再执行后续步骤。在实施代理服务步骤的基础上,步骤A6具体可以包括所述服务器端进行自动语音识别后,将识别结果通过所述代理服务器端,返回到所述客户端。还可以包括后续步骤所述代理服务器端根据所述识别结果进行计费,从而可以实现对客户端的计费功能。并且,如图1所示,本专利技术还提供了一种提供自动语音识别统一开发平台的系统,该系统的第一种实施方式包括客户端模块和服务器端模块;所述客户端模块包括数据发送单元和识别单元;其中,所述数据发送单元用于接受所述识别单元的控制、向所述服务器端模块发送语音数据,所述识别单元还用于为用户提供自动语音识别转换接口;所述服务器端模块用于实现用户的自动语音识别功本文档来自技高网...

【技术保护点】
一种提供自动语音识别统一开发平台的方法,包括以下步骤:A1、用户调用客户端的自动语音识别接口;A2、所述客户端发送自动语音识别的语法信息到服务器端;A3、所述服务器端解析所述语法信息,判断所述语法信息正确,执行步骤A4,否则不再执行后续步骤;A4、所述服务器端向所述客户端返回开始识别语音数据的请求;A5、所述客户端连接到所述服务器端,并发送用户的语音数据;A6、所述服务器端进行自动语音识别,将识别结果返回到所述客户端;A7、所述客户端向用户返回所述识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:王景平刘斌何悦唐必胜
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利