一种使用语音命令的互动方法及其系统技术方案

技术编号:3045196 阅读:151 留言:0更新日期:2012-04-11 18:40
本发明专利技术为一种使用语音命令的互动方法及其系统,尤其是一种利用辨识语音命令来控制呈现相对应的互动数据,使显示的图像产生与人互动的效果的方法及系统。其技术解决方案为:该方法包括以下步骤:1)建立存储有互动数据,以及互动数据和辨识数据对应关系的互动数据库;2)接收语音命令;3)辨识该语音命令,辨识后产生对应于该语音命令的辨识数据;4)根据该辨识数据,从互动数据库中读出对应于该辨识数据的互动数据;5)呈现互动数据。本发明专利技术解决了普通技术中存在的技术问题,具有使显示的图像和声音与人产生互动的优点。

【技术实现步骤摘要】

一种使用语音命令的互动方法及其系统,尤其是一种利用辨识语音命令来控制呈现相对应的互动数据,使显示的图像产生与人互动的效果的方法及系统。
技术介绍
声音辨识的对象包括人类发出的语音、乐器发出的音乐、机器发出的噪音、动物的叫声、声纳、大自然的声音等。简单的说,声音辨识就是以机器进行人类耳朵的听觉功能,进而使机器执行相对应的工作,来达到自动化的效果。计算机借助模拟到数字的转换装置将语音取样的数据数字化成为数值数据之后,会将输入的声音样本与预录的声音样本进行比对工作,比对完成后计算机会输出一个它认为最像的声音样本序号,于是就可以知道输入的语音要它做什么样的工作。但是,要知道即使同一个人在同一环境使用同样的麦克风连续发出两次同样的语音,语音取样数据也不可能完全相同,所以如何把语音在异中求同,这就是声音辨识技术的问题所在。也因此,在辨识人类发出的语音方面,根据词汇声音样本数量分为小字汇(<100词)、中字汇(100-1000词)、大字汇1001-10000词)、极大字汇(>10000词)几类,各类有着不同复杂度的辨识技术,以尽量提高词汇数多的类别的辨识率。虽然在数年前就已经有人提出未来语音输入将是主要的输入方式,甚至连不少大型软件商也都看好这个有着璀璨未来和庞大商机的市场,但是,由于上述所提到的语音辨识的困难度,因此语音辨识技术一直无法有效的提高输入的语音的辨识率,是故语音输入一直没有象预期的那样使用在各软件上。虽然如此,在消费性电子产品方面,随着功能上的进步,输入方式发生了显著的改变,从传统的按键输入进步到触控式屏幕的输入,甚至到现在的手写输入以及语音输入,而目前在消费性电子产品上语音输入使用的语音辨识技术,大多是语音指令&控制(Voice Command/Control)的部份,其使用的是中或小字汇的辨识技术。因此,它实际上可以辨识的词汇并不多,所以由就目前的使用情况来看,不具有亲和力,因此使用者对于目前的语音辨识技术的接受度不高。
技术实现思路
本专利技术为解决
技术介绍
中存在的上述技术问题,而提供一种利用辨识语音命令的结果来控制呈现该语音命令所对应的声音或动画,使得显示的图像和声音与人产生互动的方法及系统。本专利技术的技术解决方案是本专利技术为一种使用语音命令的互动方法,其特殊之处在于该方法包括以下步骤1)建立存储有互动数据,以及互动数据和辨识数据对应关系的互动数据库;2)接收语音命令;3)辩识该语音命令,辨识后产生对应于该语音命令的辨识数据;4)根据该辨识数据,从互动数据库中读出对应于该辨识数据的互动数据;5)呈现互动数据。上述互动数据库可下载新的互动数据,并存入该互动数据库中。上述互动数据包括动画数据、声音数据或动画数据和声音数据的合成数据。上述辨识数据还可为事件数据,当侦测到有事件发生时产生该事件数据,其中该事件可以为开机、进入屏幕保护模式、显示提示信息或关机。一种应用上述使用语音命令的互动方法的互动系统,其特殊之处在于该系统包括用来接收语音命令的语音接收模块;用来辨识该语音命令,在辨识后产生对应于该语音命令的辨识数据的语音辨识模块;用来储存互动数据的互动数据库模块;以及根据辨识数据由互动数据库模块中读出互动数据,并呈现该互动数据的互动模块,语音接收模块接入语音辨识模块,语音辨识模块和互动数据库模块分别和互动模块相接。上述系统还包括用来下载互动数据的下载模块,下载模块接入互动数据库模块。通过本专利技术的方法,在使用者利用语音命令进行输入之后,会响应该语音命令所对应的画面或声音给使用者,造成与使用者互动的效果,如此一来,将可以让语音输入的环境具有更大的亲和力,进而提高语音输入的可接受度。附图说明图1为本专利技术的互动系统的系统框图。具体实施例方式本专利技术的具体实现方法如下1)建立存储有互动数据,以及互动数据和辨识数据对应关系的互动数据库;2)接收语音命令;3)辩识该语音命令,辨识后产生对应于该语音命令的辨识数据;4)根据该辨识数据,从互动数据库中读出对应于该辨识数据的互动数据;5)呈现互动数据。其中互动数据库可下载新的互动数据,并存入该互动数据库中。互动数据包括动画数据、声音数据或动画数据和声音数据的合成数据。辨识数据还可为事件数据,当侦测到有事件发生时产生该事件数据,其中该事件可以为开机、进入屏幕保护模式、显示提示信息或关机。参见图1,本专利技术的系统包括语音接收模块110、语音辨识模块120、互动模块140、互动数据库模块150和下载模块160。其中语音接收模块110负责接收语音命令,并将接收到的语音命令送往语音辨识模块120;语音辨识模块120负责辨识语音接收模块110所接收到的语音命令,并在辨识后产生对应于语音命令的辨识数据,并将该辨识数据送往互动模块140;互动模块140负责在取得语音辨识模块120所送来的辨识数据之后,依据接收到的辨识数据由互动数据库模块150中读出对应于该辨识数据的互动数据,并且在互动数据读取完毕之后将读出的互动数据呈现出来,使使用者在听觉或视觉上受到回馈;互动数据库模块150负责储存包含有动画数据、声音数据或动画数据和声音数据的合成数据的互动数据;下载模块160用来下载互动数据,并将下载的互动数据存入互动数据库模块150。下面结合具体实施例对本专利技术做进一步的详细描述实施例一当使用者使用执行含有本专利技术的电子辞典时,使用者可以下达第一语音命令「查剑桥百科」,于是本专利技术就会接收到第一语音命令「查剑桥百科」的声音,并对第一语音命令「查剑桥百科」进行辨识,经过辨识后,本专利技术可以由互动数据库取得第一语音命令「查剑桥百科」的第一声音「没问题,请使用!」(第一互动数据),并播放第一声音给使用者听到,同时将电子字典的显示画面切换至剑桥百科的输入画面。本专利技术的互动模块140还可以侦测系统的所发生的事件(Event),并由互动数据库模块150中取得对应于系统发生的事件数据的互动数据,以呈现给使用者。当使用者将电子辞典关机时,本专利技术会侦测到系统发生关机的事件,于是本专利技术由互动数据库取得关机事件的第二声音(第二互动数据),并播放出第二声音「谢谢您的使用!」。实施例二使用者在执行含有本专利技术的个人数字助理机(PDA)进行开机时,本专利技术会在显示屏上,显示一个虚拟的图像,该虚拟的图像包含人像、动物照片、卡通人物、植物图案等,但不以此为限,第一图像以可爱美少女为例,开机画面会显示一个可爱美少女,并播放第三声音「主人您好,您需要什么服务呢?」及播放「嘴巴开阖」的第一动画(第三互动数据),使得可爱美少女看似在与使用者说话,如此会使得使用者更有与可爱美少女互动的感觉。当开机完成至使用者下达语音命令的中途,可以由本专利技术侦测发现使用者正处于闲置状态,于是读出使用者闲置的第二动画「眨眼」(第四互动数据),于是便会播放可爱美少女眨眼的动画呈现于画面上。若使用者依然继续闲置,则会进入屏幕保护模式。直到使用者下达第二语音命令「玩游戏」时,本专利技术读出对应于第二语音命令「玩游戏」的第五互动数据--可爱美少女移动到游戏选项,并有将该游戏取出的动作,接着游戏便开始执行,如此将使得可爱美少女与使用者之间互动关系更为密切。本专利技术更包括有一个下载模块160,负责将互动数据或者新的图像下载并储存至互动数据库模块150,使得使用者与图像的本文档来自技高网
...

【技术保护点】
一种使用语音命令的互动方法,其特征在于:该方法包括以下步骤:    1)建立存储有互动数据,以及互动数据和辨识数据对应关系的互动数据库;    2)接收语音命令;    3)辩识该语音命令,辨识后产生对应于该语音命令的辨识数据;    4)根据该辨识数据,从互动数据库中读出对应于该辨识数据的互动数据;    5)呈现互动数据。

【技术特征摘要】
1.一种使用语音命令的互动方法,其特征在于该方法包括以下步骤1)建立存储有互动数据,以及互动数据和辨识数据对应关系的互动数据库;2)接收语音命令;3)辩识该语音命令,辨识后产生对应于该语音命令的辨识数据;4)根据该辨识数据,从互动数据库中读出对应于该辨识数据的互动数据;5)呈现互动数据。2.根据权利要求1所述的使用语音命令的互动方法,其特征在于所述互动数据库可下载新的互动数据,并存入该互动数据库中。3.根据权利要求2所述的使用语音命令的互动方法,其特征在于所述互动数据包括动画数据、声音数据或动画数据和声音数据的合成数据。4.根据权利要求3所述的使用语音命令的互动方法,其特征在于所述辨识数据还可为事件数据...

【专利技术属性】
技术研发人员:陈建安陈淮琰
申请(专利权)人:无敌科技西安有限公司
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利