一种语音识别服务代理服务器及代理方法技术

技术编号:19487167 阅读:49 留言:0更新日期:2018-11-17 11:35
本发明专利技术公开了一种语音识别服务代理服务器及代理方法,所述服务器包括MRCP代理模块,用于接收媒体设备发送的语音流处理请求;将所述语音流处理请求发送给业务代理模块进行处理;从所述业务代理模块接收处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用;业务代理模块,用于从所述MRCP代理模块接收所述语音流处理请求;与语音业务服务器交互,实现对所述语音流的处理,将处理结果返回给MRCP代理模块。在媒体设备与ASR服务之间解耦,利于服务扩展;通过业务代理服务对ASR服务请求进行鉴权,流控,安全,反作弊等,可很好应用于公有云;通过业务代理服务下挂接其他业务模块,对ASR服务进行扩展,如搜索,翻译,识别意图等。

【技术实现步骤摘要】
一种语音识别服务代理服务器及代理方法
本专利技术涉及计算机应用技术,特别涉及一种语音识别服务代理服务器及代理方法。
技术介绍
随着ASR(AutomaticSpeechRecognition,自动语音识别)技术日趋成熟和相互结合,基于ASR的增值业务不断涌现和迅猛发展。现有技术中,媒体设备可以通过MRCP(MediaResourceControlProtocol,媒体资源控制协议)直接连接ASR服务,这样的应用方式有两个劣势:1,对于私有云有很好的支持,对于公有云支持不好,因为公有云需要有鉴权,流控,安全,反作弊等机制。原生的方法要支持公有云,要么放弃这些机制,要么让这些机制与ASR服务耦合;2,对于ASR服务,只能返回识别的文本,不能有很好的扩展,若要扩展,需要让ASR耦合其他业务模块。另外,媒体设备也可以通过HTTP对接共有云平台再对接ASR服务,这样的应用方式劣势如下:因为媒体设备通常不具备HTTP对接ASR的能力,需要进行改造。因此对接不方便,有改造成本。并且,对于ASR服务,只能返回识别的文本,不能有很好的扩展。
技术实现思路
本申请的多个方面提供了语音识别服务代理服务器、方法、设备及存储介质,能够解耦媒体设备与业务系统,提供公有云鉴权,流控,计费,安全等服务,并为ASR服务扩展知识。本申请的一方面,提供一种语音识别服务代理服务器,所述服务器包括:MRCP代理模块,用于接收媒体设备发送的语音流处理请求;将所述语音流处理请求发送给业务代理模块进行处理;从所述业务代理模块接收处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用;业务代理模块,用于从所述MRCP代理模块接收所述语音流处理请求;与语音业务服务器交互,实现对语音流的处理,将处理结果返回给MRCP代理模块。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语音业务服务器为ASR服务器和/或扩展业务服务器。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述业务代理模块包括:ASR处理子模块,用于向所述ASR服务器发送ASR请求,接收所述ASR服务器返回的语音识别结果;和/或,扩展业务处理子模块,用于向所述扩展业务服务器发送扩展业务请求,接收所述扩展业务服务器返回的扩展业务处理结果。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述业务代理模块还用于与控制服务器交互,实现对所述媒体设备的控制。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述控制服务器为鉴权/流控/计费/安全服务器;所述业务代理模块还包括:鉴权子模块,用于与所述鉴权服务器交互,实现对所述媒体设备的鉴权;流控子模块,用于与所述流控服务器交互,实现对所述媒体设备的流控;计费子模块,用于与所述计费服务器交互,实现对所述媒体设备的计费;安全子模块,用于与所述安全服务器交互,实现对所述媒体设备的安全服务。根据本申请的另一方面,提供一种基于上述语音识别服务代理服务器的语音识别服务代理方法,所述方法包括:代理服务器接收媒体设备发送的语音流处理请求;与语音业务服务器交互,实现对语音流的处理,获取处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述代理服务器接收媒体设备发送的语音流处理请求包括:所述代理服务器的MRCP代理模块接收媒体设备发送的语音流处理请求,将所述语音流处理请求发送给业务代理模块进行处理。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述与语音业务服务器交互,实现对语音流的处理包括:所述代理服务器的业务代理模块接收所述语音流处理请求,与语音业务服务器交互,实现对语音流的处理,将处理结果返回给所述MRCP代理模块。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,将所述处理结果发送给所述语音业务请求对应的业务系统应用包括:所述MRCP代理模块将所述处理结果发送给所述语音业务请求对应的业务系统应用。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语音业务服务器为ASR服务器和/或扩展业务服务器。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述业务代理模块接收所述语音流处理请求,与语音业务服务器交互,实现对所述语音流的处理包括:向所述ASR服务器发送ASR请求,接收所述ASR服务器返回的语音识别结果;和/或,向所述扩展业务服务器发送扩展业务请求,接收所述扩展业务服务器返回的扩展业务处理结果。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:所述业务代理模块与控制服务器交互,实现对所述媒体设备的控制。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述控制服务器为鉴权/流控/计费/安全服务器;所述业务代理模块与控制服务器交互,实现对所述媒体设备的控制还包括:与所述鉴权服务器交互,实现对所述媒体设备的鉴权;与所述流控服务器交互,实现对所述媒体设备的流控;与所述计费服务器交互,实现对所述媒体设备的计费;与所述安全服务器交互,实现对所述媒体设备的安全服务。本专利技术的另一方面,提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。本专利技术的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。基于上述介绍可以看出,采用本专利技术所述方案,使媒体设备与ASR服务之间,增加MRCP代理服务和业务代理服务,一来在媒体设备与ASR服务之间解耦,利于服务扩展;二来通过业务代理服务对ASR服务请求进行鉴权,流控,安全,反作弊等,可很好应用于公有云;三来通过业务代理服务下挂接其他业务模块,对ASR服务进行扩展(如搜索,翻译,识别意图等)。【附图说明】图1为本专利技术语音识别服务代理服务器的实施示意图;图2为本专利技术所述语音识别服务代理方法的流程图;图3示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器012的框图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。图1为本专利技术的语音识别服务代理服务器在语音综合平台中的实施示意图,如图1所示,示出了媒体设备、语音识别代理服务器、业务系统、ASR服务器、扩展业务服务器、控制服务器。所述媒体设备连接到语音识别代理服务器,所述语音识别代理服务器与业务系统应用、ASR服务器、扩展业务服务器、控制服务器分别连接。具体的,所述语音识别代理服务器包括MRCP代理模块和业务代理模块,所述媒体设备连接到所述MRCP代理模块,所述MRCP代理模块连接到业务代理模块。所述MRCP代理模块与业务系统相连接。所述业务代理模块与ASR服务器、扩展业务服务器、控制服务器分别连接。所述语音识别代理服务器用于接收媒体设备发送的语音流处理请求;与本文档来自技高网...

【技术保护点】
1.一种语音识别服务代理服务器,其特征在于,所述服务器包括:MRCP代理模块,用于接收媒体设备发送的语音流处理请求;将所述语音流处理请求发送给业务代理模块进行处理;从所述业务代理模块接收处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用;业务代理模块,用于从所述MRCP代理模块接收所述语音流处理请求;与语音业务服务器交互,实现对语音流的处理,将处理结果返回给MRCP代理模块。

【技术特征摘要】
1.一种语音识别服务代理服务器,其特征在于,所述服务器包括:MRCP代理模块,用于接收媒体设备发送的语音流处理请求;将所述语音流处理请求发送给业务代理模块进行处理;从所述业务代理模块接收处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用;业务代理模块,用于从所述MRCP代理模块接收所述语音流处理请求;与语音业务服务器交互,实现对语音流的处理,将处理结果返回给MRCP代理模块。2.根据权利要求1所述的代理服务器,其特征在于,所述语音业务服务器为ASR服务器和/或扩展业务服务器。3.根据权利要求2所述的代理服务器,其特征在于,所述业务代理模块包括:ASR处理子模块,用于向所述ASR服务器发送ASR请求,接收所述ASR服务器返回的语音识别结果;和/或,扩展业务处理子模块,用于向所述扩展业务服务器发送扩展业务请求,接收所述扩展业务服务器返回的扩展业务处理结果。4.根据权利要求1所述的代理服务器,其特征在于,所述业务代理模块还用于与控制服务器交互,实现对所述媒体设备的控制。5.根据权利要求4所述的代理服务器,其特征在于,所述控制服务器为鉴权/流控/计费/安全服务器;所述业务代理模块还包括:鉴权子模块,用于与所述鉴权服务器交互,实现对所述媒体设备的鉴权;流控子模块,用于与所述流控服务器交互,实现对所述媒体设备的流控;计费子模块,用于与所述计费服务器交互,实现对所述媒体设备的计费;安全子模块,用于与所述安全服务器交互,实现对所述媒体设备的安全服务。6.一种基于权利要求1-5所述语音识别服务代理服务器的语音识别服务代理方法,其特征在于,所述方法包括:代理服务器接收媒体设备发送的语音流处理请求;与语音业务服务器交互,实现对语音流的处理,获取处理结果;将所述处理结果发送给所述语音业务请求对应的业务系统应用。7.根据权利要求6所述的方法,其特征在于,所述代理服务器接收媒体设备发送的语音流处理请求包括:所述代理服务器的MRCP代理模块接收...

【专利技术属性】
技术研发人员:戴俊常月黄国瑞张伟冬先永春
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1