一种基于语音识别技术的语音鼠标系统技术方案

技术编号:14521224 阅读:126 留言:0更新日期:2017-02-02 00:07
本发明专利技术公开了一种基于语音识别技术的语音鼠标系统,通过开关控制模块输出开关量信号控制系统工作模式,通过语音采集模块采集用户语音数据,模式判断模块根据开关量信号判断是语音控制模式还是语音听写模式,分别采用本地语音识别引擎或远程语音识别服务器对语音数据进行识别,实现语音控制和语音听写,一些简单的计算机操作命令直接通过本地语音识别引擎进行识别,速度快,效率高,大大降低了与远程语音识别服务器建立联系时耗费的网络资源和系统资源,而大量复杂的语音听写工作则由远程语音识别服务器完成转写,准确率高;通过使用麦克风阵列采集用户声音信息,采集效果好,采集范围大,采集距离能达到3‑5m。

【技术实现步骤摘要】

本专利技术属于语音识别
,涉及一种语音鼠标,具体是一种基于语音识别技术的语音鼠标系统。
技术介绍
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。现有的语音识别软件基本都建立在远程语音服务器的技术基础上,由于进行在线识别转写工作时均需要与远程语音识别服务器建立联系,如果无法在具体应用时进行切换,会极大的耗费网络资源和系统资源。
技术实现思路
本专利技术的目的在于提供一种操作简单、速度快、效率高的基于语音识别技术的语音鼠标系统。本专利技术的目的可以通过以下技术方案实现:一种基于语音识别技术的语音鼠标系统,包括通过USB总线相互连接的鼠标单元和本地计算机单元,所述的本地计算机单元通过网络连接远程语音识别服务器;所述的鼠标单元包括控制开关模块,通过输入开关量信号控制系统的工作模式;语音采集模块,用于采集用户的声音信息,并转换为语音数据输出到数据预处理模块;数据预处理模块,用于对接收到的语音数据进行预处理,并将经过预处理的数据输出到鼠标USB接口;以及鼠标USB接口,用于将语音数据和开关量信号输出到本地计算机单元;所述的本地计算机单元包括计算机USB接口,用于接收鼠标单元输出的语音数据和开关量信号;模式判断模块,根据接收到的开关量信号判断系统的工作模式,将语音数据输出到本地语音识别引擎或网络接口;本地命令词库,用于存储计算机操作命令词组;本地语音识别引擎,对接收到的语音数据进行识别,并对比本地命令词库内的计算机操作命令词组,输出对应的控制指令,实现语音控制;以及网络接口,用于与远程语音识别服务器进行数据通信;所述的远程语音识别服务器用于对本地计算机单元输出的语音数据进行在线转写,并输出文字数据到本地计算机单元。进一步地,所述的系统工作模式包括停止工作模式、语音控制模式和语音听写模式,当系统处于停止工作模式时,语音采集模块停止采集用户声音信息;当系统处于语音控制模式时,通过本地语音识别引擎对语音数据进行识别,实现语音控制;当系统处于语音听写模式时,通过远程语音识别服务器对语音数据进行转写,实现语音听写。进一步地,所述的语音采集模块采用麦克风阵列。进一步地,所述的远程语音识别服务器采用讯飞语音识别服务器。本专利技术的有益效果:本专利技术提供的语音鼠标系统,通过开关控制模块输出开关量信号控制系统工作模式,通过语音采集模块采集用户语音数据,模式判断模块根据开关量信号判断是语音控制模式还是语音听写模式,分别采用本地语音识别引擎或远程语音识别服务器对语音数据进行识别,实现语音控制和语音听写,一些简单的计算机操作命令直接通过本地语音识别引擎进行识别,速度快,效率高,大大降低了与远程语音识别服务器建立联系时耗费的网络资源和系统资源,而大量复杂的语音听写工作则由远程语音识别服务器完成转写,准确率高;通过使用麦克风阵列采集用户声音信息,采集效果好,采集范围大,采集距离能达到3-5m。附图说明下面结合附图和具体实施例对本专利技术作进一步详细描述。图1是本专利技术的系统示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。如图1所示,本专利技术提供了一种基于语音识别技术的语音鼠标系统,包括通过USB总线相互连接的鼠标单元和本地计算机单元,本地计算机单元通信连接远程语音识别服务器。鼠标单元包括语音采集模块、数据预处理模块、控制开关模块以及鼠标USB接口。控制开关模块,通过输入开关量信号控制系统的工作模式;其中,系统的工作模式包括停止工作、语音控制模式和语音听写模式。语音采集模块采用麦克风阵列,当系统处于语音控制模式或语音听写模式时,采集用户的声音信息,并转换为语音数据输出到数据预处理模块,使用麦克风阵列,采集效果好,采集范围大,采集距离能达到3-5m。数据预处理模块,用于对接收到的语音数据进行预处理,并将经过预处理的数据输出到鼠标USB接口。鼠标USB接口,通过USB总线连接本地计算机单元,将语音数据和开关量信号输出到本地计算机单元。本地计算机单元包括计算机USB接口、模式判断模块、本地语音识别引擎、本地命令词库以及网络接口。计算机USB接口,通过USB总线连接鼠标单元,接收鼠标单元输出的语音数据和开关量信号。模式判断模块,对接收到的开关量信号进行判断,若为语音控制模式信号,将语音数据输出到本地语音识别引擎,若为语音听写模式,将语音数据输出到网络接口。本地命令词库,用于存储计算机操作命令词组。本地语音识别引擎,对接收到的语音数据进行识别,并对比本地命令词库内的计算机操作命令词组,输出对应的控制指令,实现语音控制。网络接口,通过网络连接远程语音识别服务器,与远程语音识别服务器进行数据通信。远程语音识别服务器采用讯飞语音识别服务器,对本地计算机单元输出的语音数据进行在线转写,并输出文字数据到本地计算机单元。本专利技术工作过程:用户通过鼠标单元的开关控制模块控制系统的工作模式,当系统处于停止工作模式,系统不采集用户声音信息,系统停止工作;当系统处于语音控制模式或语音听写模式,语音采集模块采集用户的声音信息,并转换为语音数据输出到数据预处理模块,数据预处理模块对接收到的语音数据进行预处理后通过USB总线输出到本地计算机单元。本地计算机单元通过模式判断模块对接收到的开关量信号进行判断,若为语音控制模式信号,将语音数据输出到本地语音识别引擎,本地语音识别引擎对接收到的语音数据进行识别,并对比本地命令词库内的计算机操作命令词组,输出对应的控制指令,实现语音控制;若为语音听写模式,将语音数据通过网络输出到远程语音识别服务器,远程语音识别服务器对语音数据进行在线转写,并输出文字数据到本地计算机单元,实现语音听写。本专利技术提供的语音鼠标系统,通过开关控制模块输出开关量信号控制系统工作模式,通过语音采集模块采集用户语音数据,模式判断模块根据开关量信号判断是语音控制模式还是语音听写模式,分别采用本地语音识别引擎或远程语音识别服务器对语音数据进行识别,实现语音控制和语音听写,一些简单的计算机操作命令直接通过本地语音识别引擎进行识别,速度快,效率高,大大降低了与远程语音识别服务器建立联系时耗费的网络资源和系统资源,而大量复杂的语音听写工作则由远程语音识别服务器完成转写,准确率高;通过使用麦克风阵列采集用户声音信息,采集效果好,采集范围大,采集距离能达到3-5m。为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然,在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现本文档来自技高网...

【技术保护点】
一种基于语音识别技术的语音鼠标系统,其特征在于:包括通过USB总线相互连接的鼠标单元和本地计算机单元,所述的本地计算机单元通过网络连接远程语音识别服务器;所述的鼠标单元包括控制开关模块,通过输入开关量信号控制系统的工作模式;语音采集模块,用于采集用户的声音信息,并转换为语音数据输出到数据预处理模块;数据预处理模块,用于对接收到的语音数据进行预处理,并将经过预处理的数据输出到鼠标USB接口;以及鼠标USB接口,用于将语音数据和开关量信号输出到本地计算机单元;所述的本地计算机单元包括计算机USB接口,用于接收鼠标单元输出的语音数据和开关量信号;模式判断模块,根据接收到的开关量信号判断系统的工作模式,将语音数据输出到本地语音识别引擎或网络接口;本地命令词库,用于存储计算机操作命令词组;本地语音识别引擎,对接收到的语音数据进行识别,并对比本地命令词库内的计算机操作命令词组,输出对应的控制指令,实现语音控制;以及网络接口,用于与远程语音识别服务器进行数据通信;所述的远程语音识别服务器用于对本地计算机单元输出的语音数据进行在线转写,并输出文字数据到本地计算机单元。

【技术特征摘要】
1.一种基于语音识别技术的语音鼠标系统,其特征在于:包括通过USB总线相互连接的鼠标单元和本地计算机单元,所述的本地计算机单元通过网络连接远程语音识别服务器;所述的鼠标单元包括控制开关模块,通过输入开关量信号控制系统的工作模式;语音采集模块,用于采集用户的声音信息,并转换为语音数据输出到数据预处理模块;数据预处理模块,用于对接收到的语音数据进行预处理,并将经过预处理的数据输出到鼠标USB接口;以及鼠标USB接口,用于将语音数据和开关量信号输出到本地计算机单元;所述的本地计算机单元包括计算机USB接口,用于接收鼠标单元输出的语音数据和开关量信号;模式判断模块,根据接收到的开关量信号判断系统的工作模式,将语音数据输出到本地语音识别引擎或网络接口;本地命令词库,用于存储计算机操作命令词组;本地语音识别引擎,对接收到的语音数据进行识别,并对比本地命令词库内的计算机操作命令词...

【专利技术属性】
技术研发人员:虞焰兴
申请(专利权)人:安徽声讯信息技术有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1