当前位置: 首页 > 专利查询>丽水学院专利>正文

一种面向多任务交互的手持式语音交互装置及交互方法制造方法及图纸

技术编号:13899799 阅读:70 留言:0更新日期:2016-10-25 13:34
一种面向多任务交互的手持式语音交互装置,包括可手持的壳体,所述壳体中包括以下模块:实现语音命令识别的语音识别模块,实现识别出的语音命令编码与主机间通讯的射频发送模块,给各模块供电及对电池进行充电的电源管理模块,存储语音命令的存储模块,实现语音命令输入的语音输入模块,驱动多任务的语音命令分组输入控制及反馈硬件界面,实现整个装置管理控制的控制模块,实现提示功能的指示灯,实现语音交互应用程序控制和语音命令编辑的主机。本发明专利技术还涉及上述语音交互装置所采用的交互方法。本发明专利技术中的交互装置克服了目前很多语音交互助手的弊端,使用方便,适用性广。

【技术实现步骤摘要】

本专利技术属于人机交互领域,特别涉及一种面向多任务交互的手持式无线语音交互装置;本专利技术还涉及上述交互装置的交互方法。
技术介绍
语音交互作为一种新型的人机交互方式,提供了一种脱离键盘、鼠标、触摸屏等传统图形用户界面元素的交互方式,改变了人与计算机的传统互动模式,用户只需动动口,就能打开或关闭程序、改变工作界面、控制交互进程。这种使电脑人性化的结果的目的是使每个具有语言能力的个体都能方便直接地操作和应用计算机。目前,语音交互依照其使用情境主要可分为下面几类:(1)面向智能家电的语音交互装置:这类装置具有简单的用户界面接口,基本做到用户拿起就能使用的程度,但其能支持的语音命令种类少,且语音控制命令已被固化在装置内,不能被用户编辑修改,尤其不能直接与计算机通讯,因此无法支持以计算机为支撑的交互应用。(2)面向移动平台的语音交互应用:顾名思义,这类应用的主要特点在于其“移动性”,其涵盖范围可从汽车终端等快速移动物体到用户手持终端,如智能手机。目前在市场上占有主要地位的包括苹果公司推出的Siri、google语音平台及其延伸应用和一些基于第三方语音识别引擎的语音识别应用。这类应用具有便携、开机即可用的优势,但往往需要云计算平台的支持,尤其是对语音输入的识别响应具有一定的延迟,因此难以直接支持实时交互的需求。此外,移动交互场景的背景噪声也往往导致语音命令识别率的下降。(3)面向计算机人机交互的语音识别技术:这类技术主要依赖于第三方的软件开发包,如美国IBM ViaVoice、美国微软公司、美国Nuance公司、国内科大讯飞公司等开发的语音识别应用程序开发工具包。目前这类技术虽已成为语音交互的主流,但其缺点亦显而易见:首先,对开发人员而言,往往需要耗费大量劳动进行复杂的二次开发;其次,对用户而言,往往需要在正常使用前进行一定训练,因此增加了使用上的不便。仔细考察人机语音交互的现状不难发现,其交互界面正面临着下述因素的严重制约:(1)对于多任务交互情境的支持能力不足,用户从一个应用切换到另一个应用往往需要经历较为复杂的过程。我们认为,语音命令具有很好的单个独立存在的特性,如果能提供一定的方式由用户按其需求进行命令的分类组织,语音命令将尤其适合于多任务情境交互应用
中。(2)绝大多数语音识别应用均基于特定人声设计,需要用户进行或短或长的事前训练,才能达到相对满意的识别率。(3)语音命令的识别过程在计算机终端上完成,占有了本来就比较稀缺的计算资源。(4)用户编写语音交互应用程序时首先要进行复杂的函数库的初始化,在结束时同样需要对称性地进行相应的去初始化调用;具体识别过程所涉及的库函数调用也比较复杂。(5)语音输入借助市面上的麦克风完成,缺乏独立的便携装置,这对于多任务情境应用中用户的移动往往造成一定的限制。本专利技术针对以上问题进行了研究和改进。
技术实现思路
针对现有技术中的不足,本专利技术的目的之一是提供一种面向多任务交互的手持式语音交互装置,目的之二是提供一种用于上述语音交互装置的交互方法,从语音命令层面实现多任务交互情境中人与计算机的自由、流畅的交流。本专利技术的目的之一通过以下技术方案实现:一种面向多任务交互的手持式语音交互装置,包括可手持的壳体,所述壳体中包括以下模块:实现语音命令识别的语音识别模块:进行非特定人声的语音命令识别,其功能主要由基于非特定人语音识别技术的商用语音识别芯片完成;实现识别出的语音命令编码与主机间通讯的射频发送模块:完成所识别出的语音命令编号与计算机之间的无线通讯;给各模块供电及对电池进行充电的电源管理模块:利用USB口通过主机或其他充电器对电池进行充电,并为其余模块供电;存储语音命令的存储模块:用于存储用户设定的适用于多任务交互的多组语音命令;实现语音命令输入的语音输入模块:采用固定于电路板的咪头进行语音命令信号采集,完成音频输入;驱动多任务的语音命令分组输入控制及反馈硬件界面:利用按键长按机制,实现语音命令集的分组切换。利用LED指示灯的多种状态组合提供当前语音命令集的分组反馈;实现整个装置管理控制的控制模块:采用单片机作为主控制芯片,完成整个装置的管理和控制;实现提示功能的指示灯:采用LED指示灯;实现语音交互应用程序控制和语音命令编辑的主机。以上模块结构使得本专利技术中的语音交互装置具有很好的便携性,可以独立使用,语音识别的适应性广。本专利技术的目的之二通过以下技术方案实现:一种面向多任务交互的手持式语音交互装置的交互方法,包括以下步骤:(1)用户根据多任务交互情境应用的任务确定所需采用的语音交互命令集,并经由驱动多任务的语言命令分组输入控制及反馈硬件界面进行语音命令集的分组切换;(2)用户根据装置上指示灯的闪烁提示发出语音命令;(3)采用装置自动捕获的方式完成语音命令信号输入;(4)利用语音识别模块,实现语音的在线识别;(5)识别结果编码通过无线传输给主机,用于控制语音交互应用;(6)交互应用程序接受到语音命令指令后导致的应用程序状态变化经由视觉和/或听觉通道反馈给用户,并刺激用户产生新的交互意图,从而继续语音交互流程。作为优选,步骤(3)中的自动捕获方式为:在指示灯出现闪烁时表示用户可以输入语言命令,装置即开始自动采集语言命令信号。作为优选,步骤(4)中的语音在线识别采用一种基于非特定人声的语音识别技术的在线识别方法,利用现有的商用非特定人声的语音识别芯片实现语音在线识别,达到语音命令识别的高识别率和鲁棒性。作为优选,以上方法中还包括一种语音命令的分组策略及对应于该分组策略的控制反馈机制,该分组策略及控制反馈机制用于多任务交互情境应用,包括以下步骤:a.根据多任务交互情境应用的需求确定语音命令集的分组,形成多组语音命令集;b.利用一种支持用户定制的语音命令编辑图形界面对多组语音命令集进行编辑,并存储至语音交互装置中的存储模块,用于在线语音命令识别;c.利用驱动多任务的语言命令分组输入控制及反馈硬件界面实现语音命令集的分组切换和语音命令集的分组反馈提示。作为优选,以上步骤b中,支持用户定制的语音命令编辑图形界面中的待识别的语音命令集由用户定制编辑,定制编辑方式为:通过USB连接方式将语音交互装置与主机连接,在主机端利用图形用户界面实现编辑定制。作为优选,以上步骤c中,所述的驱动多任务的语音命令分组输入控制采用按键长按机制实现语音命令集的分组切换;反馈硬件界面采用LED指示灯的多种状态组合提供当前语音命令集的分组反馈。以上方法中,装置与主机之间的通讯采用两种方式:无线数据通信方式和USB数据传输
方式。在进行在线语音命令识别时,利用无线数据通讯方式将识别到的语音命令结果发送给主机;而在离线阶段,当装置与主机通过USB接口连接时,将自动对装置内置的电池进行充电,同时,支持用户在主机上编辑定制的多组语音命令集,并将语音命令集通过USB接口传输到装置的存储模块,供在线识别阶段访问。与现有技术相比,本专利技术具有以下有益效果:本专利技术的有益效果:1)高效支持多任务交互情境中用户自然、流畅的语音命令交互;2)利用装置的手持便携性特点、驱动多任务的语言命令分组输入控制及反馈硬件界面支持用户在多任务交互情境中自由运动;3)支持非特定人声语音命令,使所研发的装置适应更广泛人群,而且无需对用本文档来自技高网
...

【技术保护点】
一种面向多任务交互的手持式语音交互装置,包括可手持的壳体,其特征在于,所述壳体中包括以下模块:实现语音命令识别的语音识别模块,实现识别出的语音命令编码与主机间通讯的射频发送模块,给各模块供电及对电池进行充电的电源管理模块,存储语音命令的存储模块,实现语音命令输入的语音输入模块,驱动多任务的语音命令分组输入控制及反馈硬件界面,实现整个装置管理控制的控制模块,实现提示功能的指示灯,实现语音交互应用程序控制和语音命令编辑的主机。

【技术特征摘要】
1.一种面向多任务交互的手持式语音交互装置,包括可手持的壳体,其特征在于,所述壳体中包括以下模块:实现语音命令识别的语音识别模块,实现识别出的语音命令编码与主机间通讯的射频发送模块,给各模块供电及对电池进行充电的电源管理模块,存储语音命令的存储模块,实现语音命令输入的语音输入模块,驱动多任务的语音命令分组输入控制及反馈硬件界面,实现整个装置管理控制的控制模块,实现提示功能的指示灯,实现语音交互应用程序控制和语音命令编辑的主机。2.权利要求1所述的一种面向多任务交互的手持式语音交互装置的交互方法,其特征在于,包括以下步骤:(1)用户根据多任务交互情境应用的任务确定所需采用的语音交互命令集,并经由驱动多任务的语言命令分组输入控制及反馈硬件界面进行语音命令集的分组切换;(2)用户根据装置上指示灯的闪烁提示发出语音命令;(3)采用装置自动捕获的方式完成语音命令信号输入;(4)利用语音识别模块,实现语音的在线识别;(5)识别结果编码通过无线传输给主机,用于控制语音交互应用;(6)交互应用程序接受到语音命令指令后导致的应用程序状态变化经由视觉和/或听觉通道反馈给用户,并刺激用户产生新的交互意图,从而继续语音交互流程。3.根据权利要求2所述的一种面向多任务交互的手持式语音交互装置的交互方法,其特征在于,步骤(3)中的自动捕获方式为:在指示灯出现闪烁时表示用户可以输入语言命令,装置即开始自动采集语言命令信号。4.根据权利要求2所述的一种面向多任务交...

【专利技术属性】
技术研发人员:潘巧明沈伟华胡伟俭万华根
申请(专利权)人:丽水学院丽水市派讯科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1