语音互动的方法及其系统技术方案

技术编号:3046252 阅读:190 留言:0更新日期:2012-04-11 18:40
一种语音互动系统,用以使一电子设备就一使用者发出的语音产生适当回应,系统包含:一侦测模组,侦测语音中是否包含一预设关键词;一辨识模组,于一第二模式下就语音予以辨识而产生一对应语意资讯;一作动模组,按照该语音资讯发送讯号至电子设备以产生回应动作;一计时模组,计算语音中前后两相邻语句间的闲置时间以判定是否超过一预设时间间隔;及一切换模组,于系统初始操作下令系统预设于第一模式,直至侦测模组测得语音中包含关键词后,即令切换模组切换至第二模式,再至计时模组判定闲置时间超过预设时间间隔后,切换模组再令系统预设于第一模式而重复上述切换动作。

【技术实现步骤摘要】

本专利技术涉及一种语音互动的方法及其系统,特别是涉及一种结合关键词及语句闲置间隔作为触发基准的语音互动的方法及其系统。
技术介绍
目前电气产品的控制介面,在不断要求便利性及人性化的考量下,除了传统的手动控制、无线遥控外,以语音互动控制的方式,由于也具有无线遥控的便利,且为人们惯用的沟通方式,所以也为产业界所发展的控制技术。其中,在语音互动控制系统中,所需的语音办识相关技术已见诸于各类技术文件中,例如以语音辨识而言,美国第5,692,097号专利揭露了一种在语音中辨识出字元的方法,美国第5,129,000号专利则揭示了一种利用音节(syllable)进行语音辨识的方法,或者如台湾公告第283744号专利揭示了一种智慧型国语语音输入方法等,足见语音辨识技术为各国现今研发重点且也渐趋实用化。目前人机间的语音互动方法,大约可略分为下列三种模式(1)随时互动(Free to Talk)、(2)按键后互动(Push to Talk)及(3)关键词后互动(Talk to Talk)。其中,如图1所示,前述的(1)随时互动及(2)按键后互动两种模式,其语音互动流程皆为在接收语音信号后,进行语音办识,并按照其办识结果,在内建的资料库中搜寻回应指令,并由安装该语音互动系统的电气设备执行回应指令,如开/关、调整音量等。此两种模式的差异性,在于按键后互动模式需在每次下指令前,先以按键或其它方式,对此电气设备启动此语音互动系统,才可以语音方式对此电气设备下达指令;而随时互动模式其语音互动系统随时皆处于一准备接收语音指令的状态,所以无需再以按键或其它方式启动语音互动系统。上述(1)、(2)两种模式虽在操作方式上易于了解,但是实际在使用上皆有其不便的地方,随时互动模式由于随时皆会将接收的语音信号当做对其所下的语音指令,所以当环境较为吵杂或使用者不是在对语音互动系统下达指令时,系统也会对接收的语音信号办识并进行回应,所以系统误动作的情形发生机率颇大。而按键后互动模式虽需在对语音互动系统下达指令前,先进行一启动互动系统的动作,也因此造成使用者使用上的不便,及大幅降低此种语音互动操控方式较其它操控方式最大的差异及优势所在。如图2所示,上述(3)关键词后互动模式其语音互动系统也随时处于一待命状态,但是其最大特征在于需接收到一关键词后,此语音互动系统才会对安装此系统的电气设备执行指令,所以可改善系统误动作发生的机率。其使用缺点则由于每次使用者在下达指令前皆需下达一触发关键词,若假设系统关键词为”杰克”,而装设此系统的设备为一多媒体播放设备,在使用上就会出现类似如下的对话状况使用者杰克,启动CD player;系统好的,为你启动CD player;使用者杰克,播放xxx的歌;系统好的,为你播放xxx的CD;使用者杰克,播放第三首;系统好的,为你播放第三首;使用者杰克,大声点;系统好的,为你调大音量。从如此的过程中可知,使用者在每次下指令前都要讲一次关键词,对使用者而言极为不便也不友善。
技术实现思路
因此,本专利技术的目的,即在提供一种可达到降低误动作机率功效的语音互动方法及其系统。于是,本专利技术语音互动系统,用以使一电子设备就一使用者发出的语音产生适当回应,该系统包含一侦测模组,侦测语音中是否包含一预设关键词;一辨识模组,于一第二模式下就语音予以辨识而产生一对应语意资讯;一作动模组,按照该语音资讯发送讯号至电子设备以产生回应动作;一计时模组,计算语音中前后两相邻语句间的闲置时间以判定是否超过一预设时间间隔;及一切换模组,于系统初始操作下令系统预设于第一模式,直至侦测模组测得语音中包含关键词后,即令切换模组切换至第二模式,再至计时模组判定闲置时间超过预设时间间隔后,切换模组再令系统预设于第一模式而重复上述切换动作。对应于上述语音互动系统,本专利技术语音互动方法,则包括下述步骤A)针对该语音进行一预设关键词辨识;B)当经辨识该语音包含关键词,即对语音对应的语意资讯进行辨识;C)发送一对应语意资讯的讯号至电子设备的对应部位,使电子设备产生对应该资讯的回应动作;D)于辨识语意资讯的同时计算语音中任意前后相邻两语句间的闲置时间;及E)判定闲置时间是否超过一预设时间间隔,当闲置时间超过预设时间间隔时,返回步骤A)并重复上述各步骤。本专利技术还揭示一种选择性语音辨识系统,用以选择性辨识一使用者发出的语音,该系统包括一侦测模组,侦测语音中是否包含一预设关键词;一辨识模组,于一第一模式下不就语音产生反应,而于一第二模式下则就语音予以辨识;一计时模组,配合辨识模组于第二模式下辨识语音的动作,而计算语音中任意前后相邻两语句间的闲置时间,以判定闲置时间是否超过一预设时间间隔;及一切换模组,于系统初始操作下令系统预设于第一模式,直至侦测模组测得语音中包含关键词后,即令切换模组切换至第二模式,再至计时模组判定闲置时间超过预设时间间隔后,切换模组即令系统再度预设于第一模式而重复上述切换动作。对应于上述选择性语音辨识系统,本专利技术并揭示一种选择性语音辨识方法,包括下述步骤A)针对一语音进行一预设关键词辨识;B)当经辨识该语音包含该关键词,即对该语音对应的语意资讯进行辨识;D)于辨识该语意资讯的同时,计算该语音中任意前后相邻两语句间的闲置时间;及E)判定该闲置时间是否超过一预设时间间隔,当该闲置时间超过该预设时间间隔时,返回步骤A)并重复上述各步骤。再者,本专利技术另揭示一种具语音互动功能的电子设备,用以就一使用者发出的语音产生适当回应,该电子设备包括一收音模组,用以接收语音;一侦测模组,自收音模组接收语音以侦测语音中是否包含一预设关键词;一辨识模组,于一第一模式下不就语音产生反应,而于一第二模式下则自收音模组接收语音,以就语音予以辨识而产生语音对应的语意资讯;一作动模组,接收辨识模组于第二模式获得的语意资讯,而发送讯号至电子设备的对应部位以产生对应该资讯的回应动作;一计时模组,配合辨识模组于第二模式下辨识语音的动作,而计算语音中任意前后相邻两语句间的闲置时间,以判定闲置时间是否超过一预设时间间隔;及一切换模组,于系统初始操作下令电子设备预设于第一模式,直至侦测模组测得语音中包含该关键词后,即令切换模组切换至第二模式,再至计时模组判定闲置时间超过预设时间间隔后,切换模组即令电子设备再度预设于第一模式而重复上述切换动作。对应于上述具语音互动功能的电子设备,本专利技术并揭示一种语音互动方法,包括下述步骤A)针对一语音进行一预设关键词辨识;B)当经辨识该语音包含关键词,即对语音对应的语意资讯进行辨识;C)针对语意资讯产生对应的回应动作;D)于辨识语意资讯的同时,计算语音中任意前后相邻两语句间的闲置时间;及E)判定闲置时间是否超过一预设时间间隔,当闲置时间超过预设时间间隔时,返回步骤A)并重复上述各步骤。附图说明下面结合附图及实施例对本专利技术进行详细说明图1是一流程图,说明一般随时互动及按键后互动的语音互动模式的动作步骤。图2是一流程图,说明一般关键词后互动的语音互动模式的动作步骤。图3是一系统方块图,说明具有本专利技术语音互动系统的电子设备的较佳图4是一系统方块图,说明本专利技术语音互动系统的较佳实施例。图5是一方块流程图,说明本专利技术一收音及侦测模组的动作流程。图6是一流程图,说明本专利技术语音互动方法的步本文档来自技高网
...

【技术保护点】
一种语音互动系统,用于安装于一电子设备,以使该电子设备就一使用者发出的语音产生适当回应,其特征在于:该系统包括:一侦测模组,侦测该语音中是否包含一预设关键词;一辨识模组,于一第一模式下不就该语音产生反应,而于一第二模 式下则就该语音予以辨识而产生该语音对应的语意资讯;一作动模组,接收该辨识模组于该第二模式获得的该语意资讯,而发送讯号至该电子设备的对应部位以产生对应该资讯的回应动作;一计时模组,配合该辨识模组于该第二模式下辨识该语音的动作, 而计算该语音中任意前后相邻两语句间的闲置时间,以判定该闲置时间是否超过一预设时间间隔;及一切换模组,令该系统于该第一模式及该第二模式间切换,该系统初始操作下,该切换模组将令该系统预设于该第一模式,直至该侦测模组测得该语音中包含该关键 词后,即令该切换模组切换至该第二模式,再至该计时模组判定该闲置时间超过该预设时间间隔后,该切换模组即令该系统再度预设于该第一模式而重复上述切换动作。

【技术特征摘要】
1.一种语音互动系统,用于安装于一电子设备,以使该电子设备就一使用者发出的语音产生适当回应,其特征在于该系统包括一侦测模组,侦测该语音中是否包含一预设关键词;一辨识模组,于一第一模式下不就该语音产生反应,而于一第二模式下则就该语音予以辨识而产生该语音对应的语意资讯;一作动模组,接收该辨识模组于该第二模式获得的该语意资讯,而发送讯号至该电子设备的对应部位以产生对应该资讯的回应动作;一计时模组,配合该辨识模组于该第二模式下辨识该语音的动作,而计算该语音中任意前后相邻两语句间的闲置时间,以判定该闲置时间是否超过一预设时间间隔;及一切换模组,令该系统于该第一模式及该第二模式间切换,该系统初始操作下,该切换模组将令该系统预设于该第一模式,直至该侦测模组测得该语音中包含该关键词后,即令该切换模组切换至该第二模式,再至该计时模组判定该闲置时间超过该预设时间间隔后,该切换模组即令该系统再度预设于该第一模式而重复上述切换动作。2.按照权利要求1所述的语音互动系统,其特征在于该语音互动系统更包括一交谈模组,用以接收该辨识模组于该第二模式获得的该语意资讯,而针对该资讯发送一对应的回复语音信号至该电子设备的对应部位,以发出该回复语音。3.按照权利要求2所述的语音互动系统,其特征在于该电子设备具有一发音模组,且该交谈模组具有一声音资料库,以针对该语意资讯自该声音资料库撷取一对应的回复声音档案,而将该声音档案发送至该发音模组。4.按照权利要求1至3中任一项所述的语音互动系统,其特征在于该交谈模组并针对该语意资讯发送一对应的回复图像信号至该电子设备的对应部位,以发出该回复图像。5.按照权利要求4项所述的语音互动系统,其特征在于该电子设备具有一显示模组,且该交谈模组具有一图象资料库,以针对该语意资讯自该图象资料库撷取一对应的回复图像档案,而将该图像档案发送至该显示模组。6.按照权利要求1项所述的语音互动系统,其特征在于该侦测模组具有一撷取该语音信号特征参数的特征参数撷取单元、一利用该特征参数建立语音模型的语音模型建立单元、一储存该关键词语音模型的关键词语音模型单元,及一用以比对所述语音模型间相似度的语音模型比对单元。7.按照权利要求1项所述的语音互动系统,其特征在于该辨识模组具有一存有复数语音模型样本的资料库,及一辨识语音模型间相似度的语音模型辨识单元。8.一种选择性语音辨识系统,用以选择性辨识一使用者发出的语音,其特征在于该系统包括一侦测模组,侦测该语音中是否包含一预设关键词;一辨识模组,于一第一模式下不就该语音产生反应,而于一第二模式下则就该语音予以辨识;一计时模组,配合该辨识模组于该第二模式下辨识该语音的动作,而计算该语音中任意前后相邻两语句间的闲置时间,以判定该闲置时间是否超过一预设时间间隔;及一切换模组,令该系统于该第一模式及该第二模式间切换,该系统初始操作下,该切换模组将令该系统预设于该第一模式,直至该侦测模组测得该语音中包含该关键词后,即令该切换模组切换至该第二模式,再至该计时模组判定该闲置时间超过该预设时间间隔后,该切换模组即令该系统再度预设于该第一模式而重复上述切换动作。9.一种具语音互动功能的电子设备,用以就一使用者发出的语音产生适当回应,其特征在于 该电子设备包括一收音模组,用以接收该语音;一侦测模组,自该收音模组接收该语音以侦测该语音中是否包含一预设关键词;一辨识模组,于一第一模式下不就该语音产生反应,而于一第二模式下则自该收音模组接收该语音,以就该语音予以辨识而产生该语音对应的语意资讯;一作动模组,接收该辨识模组于该第二模式获得的该语意资讯,而按照...

【专利技术属性】
技术研发人员:许天明
申请(专利权)人:宏碁股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1