语音识别控制系统和方法技术方案

技术编号:5257270 阅读:222 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种语音识别控制系统和方法。其中,该语音识别控制系统包括:语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输入语音消息中间件;语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息;将所述语音消息发送至需要所述语音消息的应用单元;应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中的文本信息控制所述应用单元的运行状态。本发明专利技术具有通用性,可以适用于各种功能的应用单元。

【技术实现步骤摘要】

本专利技术实施例涉及语音控制技术,尤其涉及一种。
技术介绍
电视、电脑、手机等显示终端的业务操作,对普通家庭用户,特别是对于老人或者 孩子来说,手动操作方法复杂。通过语音控制终端设备的业务操作可以简化操作方法,例 如,用户可以在手机中通过语音查电话号码、写短信等。当前,通过语音控制终端设备的应用单元,通常有两种方式。一种方式为将语音 识别模块与某一特定的应用单元绑定,将语音识别模块的语音识别能力作为特定的应用单 元的能力,在这种情况下,语音识别能力不能被其他的应用单元使用,无法通用。另一种方 式为终端设备提供公用的语音识别模块,设备中的其它应用单元通过特定的应用编程接 口(API)调用语音识别模块,以获取语音识别能力;在这种情况下,在终端中不能由多个设 备同时使用语音识别模块,存在局限性。综上所述现有技术中语音控制的适用范围小,且不能通用。
技术实现思路
本专利技术提供一种,用以解决现有技术中语音控制的适用 范围小,且不能通用的缺陷,实现具有通用性的语音控制,适用范围广。本专利技术实施例提供一种语音识别控制系统,包括语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信 号输入语音消息中间件;语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消 息,所述语音消息中携带所述语音信号对应的文本信息将所述语音消息发送至需要所述语 音消息的应用单元;应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消 息中的文本信息控制所述应用单元的运行状态。本专利技术实施例提供一种语音识别控制方法,包括对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所 述语音信号对应的文本信息;将所述语音消息发送至需要所述语音消息的应用单元,以使所述应用单元根据所 述语音消息中的文本信息控制应用单元的运行状态。本专利技术提供的,通过语音消息中间件对语音输入设备输 入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该 消息类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运 行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根 据这些附图获得其他的附图。图1为本专利技术实施例一提供的语音识别控制系统的结构示意图;图2为本专利技术实施例二提供的语音识别控制系统的结构示意图;图3为本专利技术实施例三提供的语音识别控制方法的流程示意图;图4a为本专利技术实施例四提供的语音识别控制方法的流程示意图;图4b为本专利技术实施例四提供的语音识别控制方法的信令流程示意图;图5a为本专利技术实施例五提供的语音识别控制方法的流程示意图;图5b为本专利技术实施例五提供的语音识别控制方法中消息管理的信令流程示意 图;图5c为本专利技术实施例五提供的语音识别控制方法中消息通知的信令流程示意 图;图6a为本专利技术实施例六提供的语音识别控制方法中注册过程的流程示意图;图6b为本专利技术实施例六提供的语音识别控制方法中注册过程的信令流程示意 图;图6c本专利技术实施例六提供的语音识别控制方法中注销过程的流程示意图;图6d为本专利技术实施例六提供的语音识别控制方法中注销过程的信令流程示意 图;图6e为本专利技术实施例六提供的语音识别控制方法中状态控制的信令流程示意 图。具体实施例方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例 中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一图1为本专利技术实施例一提供的语音识别控制系统的结构示意图,如图1所示,该语 音识别控制系统包括语音输入设备15、语音消息中间件13和应用单元11。其中,语音输入设备15,用于对接收到的语音信号进行采样,得到语音信号;将所 述语音信号输入语音消息中间件;语音消息中间件13,用于对所述语音输入设备输入的语音信号进行识别得到语音 消息,所述语音消息中携带所述语音信号对应的文本信息;将所述语音消息发送至需要所 述语音消息的应用单元;应用单元11,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音 消息中的文本信息控制所述应用单元的运行状态。具体地,语音消息中间件是一种可以运行在例如、电脑、手机、机顶盒等设备的操 作系统之上的服务性应用。语音消息是以语音作为输入源,通过特定的语音处理与识别处 理技术,将语音转换为可以识别和处理的信息。例如,用户以语音方式输入“关机”的语音 指令,通过语音消息中间件处理后,可以变成“关机”的文本指令或者其它应用可以识别和 处理的指令格式。其中,语音消息中至少包括识别出来的文本信息。文本信息也可以叫做 语音消息的消息内容,可以是精确的消息描述,也可以是模糊的消息描述。例如,“关机”的 语音输入的消息内容可以识别为“关机”的精确文本指令,也可以是“XX关机XX”等模糊文 本指令。由于语音识别经常具备模糊性,所以,语音消息中包含的消息内容可以支持模糊性 描述,各种应用单元可具备模糊性语音消息的处理能力。具体实现时,语音消息的内容可 以使用XML格式描述,也可以使用其它文本或二进制方式描述,可以根据实际需要确定。因 此,语音消息识别子系统识别语音信号时,根据消息特征库,可能将同一条语音信号识别出 一条或多条文本信息。在应用单元中可以包括文本消息特征库,应用单元处理文本信息的 方法具体可以包括以下情况情况一、如果语音消息中只包含单条文本信息,应用单元可以分离出语音消息中 的文本信息,将文本信息转换成执行指令。应用单元的消息处理模块检索和比对文本消息 特征库,将文本信息转换成执行指令。如果转换成功,则执行获取的执行指令。处理完成语 音消息后,删除语音消息。例如,语音上网应用单元获取到包含文本信息“搜索开机”的语音消息时,上网应 用分离出“搜索”执行指令,并将“开机”作为搜索的具体内容,此时,语音上网应用单元可 以直接启动上网功能并搜索“开机”相关的信息。但是,如果是开关机应用单元接收到包含 文本信息“搜索关机”的语音消息,则处理过程可以是开关机应用单元识别出其中包含“关 机”信息时,可以弹出对话框,提示用户是否确认“关机”,如果用户选择是,则开关机应用单 元生成关机指令并执行。再如,语音上网应用单元获取到仅包含文本信息“开机”的语音消息时,由于语音 上网应用单元未找到其支持的可以转化成执行指令的文本信息例如“搜索”等,则仅将“开 机”作为搜索的内容,但不执行搜索过程,直至下次再接收到包含“搜索”的语音消息时,才 执行搜索“开机”的过程;也可以将仅包含文本信息“开机”的语音消息丢弃或不处理。情况二、语音消息中包含多条文本信息时由于方言、环境不同,同一条语音信息可能被识别出多条文本信息。如果识别出多 条文本信息,则生成的语音消息中可以包括多条文本信息,并且根据消本文档来自技高网...

【技术保护点】
一种语音识别控制系统,其特征在于,包括:语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输入语音消息中间件;语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息,将所述语音消息发送至需要所述语音消息的应用单元;应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中的文本信息控制所述应用单元的运行状态。

【技术特征摘要】

【专利技术属性】
技术研发人员:加雄伟
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1