基于编组方式的语音库实现语音识别系统及其方法技术方案

技术编号:7845770 阅读:263 留言:0更新日期:2012-10-13 03:30
本发明专利技术提供一种基于编组方式的语音库实现语音识别系统,包括通过网络互相连接的用户终端、语音识别终端以及服务器端;用户终端可以设置存储在服务器端中的语音库;利用对语音库进行编组,在从中调取部分所需的指令组到语音命令栈中进行小型语音库识别判断;语音识别终端接收用户发出的语音指令,并将其转换为语音命令到语音命令栈中查找对应的指令后,通过服务器端对设备进行操作;本发明专利技术还提供了一种基于编组方式的语音库实现语音识别方法,实现了在保证设备的语音识别率不下降的前提下和识别速度不降低的基础上,对语音识别系统进行了优化,扩大手持设备的语音库,减少了用户根据语音做识别时产生的错误概率,增加了语音判别时的识别能力。

【技术实现步骤摘要】

本专利技术涉及一种。
技术介绍
随着时代的发展和进步,通过语音转成文字或拼音;文字或拼音转成语音的技术越来越成熟,语音库的容量也越做越大,一般地在用于进行语音识别以及说话者识别的语 音处理中,涉及的语音库的信息量都比较大,这样语音识别引擎在进行语音识别时容易造成错误识别,使之进行错误的操作。在现有技术中的语音识别引擎中,存在这样的问题当设备进行语音识别判断时输入语音信号,由于语音库信息量较大,导致语音识别引擎进行判断时识别率可能会下降。因此语音识别引擎在进行语音识别时,在保证识别率不下降的前提下,如何使语音识别引擎更优,着实是一个待解决的问题。云服务器,是一种基于WEB服务,提供可调整云主机配置的弹性云技术,整合了计算、存储与网络资源的Iaas (全称Infrastructure as a Service,即基础设施即服务)服务,具备按需使用和按需即时付费能力的云主机租用服务。在灵活性、可控性、扩展性及资源复用性上都有很大的提高。现有技术中公开了一种“家庭网络系统及其控制方法”公开号为CN102255780A,公开日为2011. 11.23的中国专利,所述家庭网络系统通过网络连接家庭各空间设置的至少一台电子/电器装置,其特征点是语音识别装置,其在家庭内至少设置一台,并具有语音识别功能和遥控功能,且用于识别使用者的语音指令,将其与所指定的控制对象一电子/电器装置的ID进行匹配之后,通过RF通信来传输控制数据;中继器,以预定方式与所述电子/电器装置相连接,并接收、复原从所述语音识别装置通过RF通信传输的控制数据,从而对ID进行分析,且判断是否是对自身的执行命令,如果是就执行所连接的电子/电器装置的操作,将控制操作的执行结果通过RF通信传输给所述语音识别装置。所述方法包括以下步骤当语音识别装置或者中继器检测到语音输入,就对其进行识别和分析,从而判断是否包含有所指定的识别语;若没有包含有所指定的识别语,则删除己识别的语音;若包含有所指定的识别语,则将该语音判断为语音指令;对语音指令进行分析,提取作为控制对象的电子/电器装置的ID,并将包含控制命令在内的语音转换为控制数据;将所述控制数据以RF通信传输给连接在对应的电子/电器装置上的中继器;通过RF通信接收控制数据的中继器分析控制数据中所包含的ID,并判断是不是自身的控制命令,若是自身的控制命令,则使电子/电器装置执行相应操作;以及若根据通过RF通信接收的控制数据执行操作,则将其结果以RF信号传输并通知发送控制数据的语音识别装置或者中继器。该专利技术构建了家庭网络系统,通过控制基于语音识别的无线家庭网络不仅提供了使用方便,而且还提高了有效性。但该专利技术的语音识别的无线家庭网络中也会存在语音识别引擎在进行语音识别时容易造成错误识别的问题
技术实现思路
本专利技术要解决的技术问题之一,在于提供一种基于编组方式的语音库实现语音识别系统,减少了用户根据语音做识别时产生的错误概率。本专利技术的问题之一是这样实现的一种基于编组方式的语音库实现语音识别系统,所述语音识别系统包括通过网络互相连接的至少一用户终端、至少一服务器端以及一语音识别终端; 所述用户终端包括计算机终端和移动设备终端;所述移动设备终端包括手机和平板电脑。用户终端能设置存在服务器端中的语音库,进行远程更新及修改语音库,且能对语音库中的语音进行编组设置;所述语音库中设置有复数个指令组,所述一个指令组内分为一级语音指令和二级语音指令组;一个一级语音指令对应一个二级语音指令组,每个二级语音指令组中设有复数条二级语音指令;一级语音指令是指令组的组名,二级语音指令组中各二级语音指令为相应设备的操作指令; 所述服务器端包括一语音库,语音库内有着用户进行编辑设置所述各指令组,每条二级语音指令都有着对应的设备操作动作,语音库中每条语音指令都设有一语音反馈信息; 所述语音反馈信息为语音指令操作动作后,进行的语音提醒信息; 所述语音识别终端设置有一语音识别引擎和一语音命令栈,该语音识别引擎用于收集用户发出的语音,将语音转为文字或拼音形式或语音波形的语音指令;语音命令栈设有指令空间,该指令空间用于存放从服务器端中发送过来的指令集合;所述指令集合为语音指令在服务器端的语音库中进行查询得到一级语音指令下对应的所有二级语音指令组;用户能通过查询得到的所有二级语音指令中来选择要控制操作设备的某一二级语音指令,并根据该二级语音指令通过服务器端来对相应设备进行相应的动作操作。本专利技术要解决的技术问题之二,在于提供一种基于编组方式的语音库实现语音识别方法。本专利技术的问题之二是这样实现的一种基于编组方式的语音库实现语音识别方法,包括如下步骤 步骤10、用户通过一用户终端设置存在服务器端中的语音库,对语音库中的语音进行指令组编组设置,一个指令组组内分为一级语音指令和二级语音指令组;所述一级语音指令用于标示指令组的组名,所述二级语音指令组中各二级语音指令为相应设备的操作指令;所述用户终端包括计算机终端和移动设备终端; 步骤20、将设置好的各指令组中的一级语音指令和二级语音指令组存放于语音库中,上传至服务器端更新语音库; 步骤30、用户通过一语音识别终端发送要操作设备的语音,所述语音识别终端设置有一语音识别引擎和一语音命令栈,该语音识别引擎接收用户发出的语音,将语音转为文字或拼音形式或语音波形的语音指令;用户在使用一语音识别终端时,首先发出的语音要为一级语音指令的语音; 步骤40、语音识别终端接收到转化后语音指令后传输到语音命令栈中进行搜索对应的一级语音指令,搜索到对应的一级语音指令后通知用户并使语音识别终端进入待机状态;在语音命令栈中搜索不到对应的一级语音指令时,语音识别终端通过网络将转化后语音指令传输发送到服务器端中进行语音库搜索对比,如搜索到对应的一级语音指令所属的指令组,则通过一级语音指令查询该指令组中二级语音指令组的指令数,将该指令组传输给语音识别终端中的所述语音命令栈,并语音通知用户并进入待机状态; 步骤50、用户在获得一级语音指令通知后,用户输入二级语音指令,该二级语音指令要为步骤40中一级语音指令所对应的二级语音指令组中的二级语音指令,用户在输入二级语音指令后,在语音命令栈中判断步骤40中一级语音指令对应的指令组中是否存在用户输入的二级语音指令,如不存在,则返回步骤40 ;如存在,则在语音命令栈中搜索到该二级语音指令后根据该二级语音指令所对应的设备操作动作指令传送给服务器端,服务器端将对应的设备进行相应的动作操作;从而完成语音识别。本专利技术具有如下优点本专利技术在保证设备的语音识别率不下降的前提下,对语音识别系统进行了优化,减少了用户根据语音做识别时产生的错误概率,通过从语音库中调取出所需的一部分语音命令进行操作,使语音判别时识别能力增强。通过云服务器中进行备份语音库,防止用户的服务器端中语音库出现错误导致用户花费多余时间进行重新设置的问题。利用分组将房间内的设备的语音命令进行整合,在要在当前房间进行语音操作时不用考虑到别的房间的设备的语音操作命令,减少用户操作错误概率;同时也加快了语音识别弓I擎对设备的语音识别操作。附图说明图I为本专利技术系统的结构框架图。图2为本专利技术方法的流程示意图。图3为本专利技术方法中用户设置语音库的流程示意图。图4为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于编组方式的语音库实现语音识别系统,其特征在于所述语音识别系统包括通过网络互相连接的至少一用户终端、至少一服务器端以及一语音识别终端; 所述用户终端包括计算机终端和移动设备终端;所述移动设备终端包括手机和平板电脑;用户终端能设置存在服务器端中的语音库,进行远程更新及修改语音库,且能对语音库中的语音进行编组设置;所述语音库中设置有复数个指令组,所述一个指令组内分为一级语音指令和二级语音指令组;一个一级语音指令对应一个二级语音指令组,每个二级语音指令组中设有复数条二级语音指令;一级语音指令是指令组的组名,二级语音指令组中各二级语音指令为相应设备的操作指令; 所述服务器端包括一语音库,语音库内有着用户进行编辑设置所述各指令组,每条二级语音指令都有着对应的设备操作动作,语音库中每条语音指令都设有一语音反馈信息;所述语音反馈信息为语音指令操作动作后,进行的语音提醒信息; 所述语音识别终端设置有一语音识别引擎和一语音命令栈,该语音识别引擎用于收集用户发出的语音,将语音转为文字或拼音形式或语音波形的语音指令;语音命令栈设有指令空间,该指令空间用于存放从服务器端中发送过来的指令集合;所述指令集合为语音指令在服务器端的语音库中进行查询得到一级语音指令下对应的所有二级语音指令组及该一级语音指令;用户能通过查询得到的所有二级语音指令中来选择要控制操作设备的某一二级语音指令,并根据该二级语音指令通过服务器端来对相应设备进行相应的动作操作。2.根据权利要求I所述的基于编组方式的语音库实现语音识别系统,其特征在于所述语音识别终端包括为有容量的手持语音接收设备、手机和平板电脑。3.根据权利要求I所述的基于编组方式的语音库实现语音识别系统,其特征在于用户在用户终端上能按个人喜欢的口令方式将设备对应的二级语音指令进行更改或设置。4.根据权利要求I所述的基于编组方式的语音库实现语音识别系统,其特征在于所述语音识别终端中的语音命令栈内设置有的指令空间;当从服务器端中发送过来的指令集合的指令数目超出所述语音命令栈的指令空间时,将语音命令栈中的栈底的指令组进行删除操作,直至指令空间足够存放。5.一种基于编组方式的语音库实现语音识别方法,其特征在于包括如下步骤 步骤10、用户通过一用户终端设置存在服务器端中的语音库,对语音库中的语音进行指令组编组设置,一个指令组组内分为一级语音指令和二级语音指令组;所述一级语音指令用于标示指令组的组名,所述二级语音指令组中各二级语音指令为相应设备的操作指令;所述用户终端包括计算机终端和移动设备终端; 步骤20、将设置好的各指令组中的一级语音指令和二级语音指令组存放于语音...

【专利技术属性】
技术研发人员:林声滨
申请(专利权)人:厦门思德电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1