多模态嵌入界面的可替换定制的方法和设备技术

技术编号:3555530 阅读:146 留言:0更新日期:2012-04-11 18:40
根据本发明专利技术的一些方面,移动语音通信设备包括发射和接收听觉信息和数据的无线收发器电路,处理器,和存储可执行指令的存储器,当在处理器上执行时,所述可执行指令使移动语音通信设备向移动语音通信设备的用户提供与用户界面相关的可选个性。可执行指令包括在所述设备上实现采用具有可选个性的不同用户提示的用户界面,其中所述多个用户提示的每个可选个性被定义和映射到存储在移动语音通信设备的至少一个数据库中的数据。移动语音通信设备包括识别用户口头输入并提供识别的对应单词的解码器,和合成与识别的单词对应的单词的语音合成器。所述设备包括或者无线传送给所述设备,或者通过计算机接口传送的,或者以存储卡的形式提供给所述设备的用户可选个性。

【技术实现步骤摘要】
【国外来华专利技术】多模态嵌入界面的可替换定制的方法和设备
本专利技术涉及具有语音识别能力的无线通信设备。
技术介绍
许多移动通信设备,比如蜂窝电话机(这里意味着至少包含执行电话机或语音通信功能的数据处理和设备)具备语音辅助的界面特征,所述界面特征使用户可通过说出调用某一功能的表述而访问该功能。一种常见的例子是语音拨号,藉此用户对电话机说出姓名或者其它预先存储的表述,电话机通过拨打与该姓名相关的号码作出响应。在备选方案中,显示器和小键盘向用户提供键入文本串的可视界面,电话机响应于所述文本串。为了验证将被拨打的号码或者要调用的功能是否确实是用户想要的号码或功能,移动电话机可向用户显示确认消息,如果正确的话则允许用户继续下去,如果不正确的话则异常中断该功能。存在用于与移动电话机交互作用的听觉和/或视觉用户界面。与视觉确认和界面相比,听觉确认和其它用户界面便于更加免除用手的操作,例如希望始终注视道路而不是查看电话机的驾驶员可能需要这样的操作。在移动电话机中,语音识别被用于识别电话机的用户说出的短语、单词、声音(这里一般指的是语调)。于是,语音识别有时用在电话簿应用中。在一个例子中,电话机对识别的口述姓名报以通过电话机的扬声器输出表现的听觉确认。当收到该重放时,用户接受或拒绝电话机的识别结果。这些界面(听觉界面和视觉界面)的一个特征在于它们都具有个性,不论是设计的还是无意的。就现有的商用设备(例如三星i7000-->设备)来说,蜂窝电话机的内部语音具有被描述成“女士”的个性。多数目前的设备都是非常类似于事务的,具有扼要并且通常缺乏语调的短暂提示,比如“please”、“thank you”或者甚至“like”。
技术实现思路
根据本专利技术的一些方面,移动语音通信设备包括发射和接收听觉信息和数据的无线收发器电路,处理器,和存储可执行指令的存储器,当在处理器上执行时,所述可执行指令使移动语音通信设备向移动语音通信设备的用户提供与用户界面相关的可选个性。可执行指令包括在所述设备上实现采用具有可选个性的不同用户提示的用户界面,其中所述多个用户提示的每个可选个性被定义,并且被映射到存储在移动语音通信设备的至少一个数据库中的数据。移动语音通信设备包括识别用户口头输入并提供识别的对应单词的解码器,以及合成与识别的单词对应的单词的语音合成器。解码器包括语音识别引擎。移动通信设备是蜂窝电话机。移动语音通信设备包括具有发音数据库,合成器数据库和用户界面数据库之一的至少一个数据库。发音数据库包括代表字母-音素转换规则和/或多个特殊单词的清楚发音,以及语音修改规则的数据。合成器数据库包括代表音素-声音转换规则,速度控制和/或音调控制的数据。用户界面数据库包括代表预先记录的听觉提示、与听觉提示相关的文本、屏幕图像和动画脚本的数据。收发器电路具有音频输入装置和音频输出装置。可选个性包括独特的语音、口音、单词选择、语法结构和隐式包含。本专利技术的另一方面提供了一种操作包含语音识别能力的通信设备的方法,包括在设备上实现采用多种不同的用户提示的用户界面,其中不同用户提示的每个用户提示或者用于向用户请求对应的口头输入,或者将设备的动作或状态通知用户,每个用户提示具有出自多种不同个性中的一个可选个性。所述多种不同个性中的每个个性被映射到不同用户提示中的一个不同的对应用户提示;当设备的用户选择任-->意一种个性时,所述方法包括产生被映射到所选个性的用户提示。所述多种用户提示中的每种用户提示具有对应的语言表现,并且当产生所选个性的用户提示时,还通过用户界面产生对应的语言表现。所述方法还包括当通过设备的用户界面产生对应的语言表现时,还可听见地向具有所选个性的用户提供所述语言表现。所述方法包括实现具有不同用户提示的多个用户可选模式,每种不同的用户提示具有不同的个性。移动通信设备包括当通过随机地转换个性,从而随机选择用户界面的个性时,还能够向用户呈现多种个性,从而近似“精神分裂型”的(schizophrenic)电话设备的用户可选模式。用户可选个性可被无线传送给移动通信设备,通过计算机接口传送,或者当嵌入存储装置时被提供给移动通信设备。一般来说,在另一方面,本专利技术的特征在于一种方法,所述方法包括:在数据存储器中存储多个个性数据文件,每个个性数据文件配置一种模仿对应的一种不同个性的许可语音的应用;从用户接收对选择的一个个性数据文件的电子请求;向用户请求对所选个性数据文件的支付义务(payment obligation);响应从用户收到支付义务,以电子方式将选择的个性数据文件传送给用户,以便安装在包含许可语音的应用的设备中。如附图中所示,根据本专利技术的实施例的下述更详细说明,本专利技术的上述特征和优点将变得明显。附图说明图1是图解说明用于这里描述的定制方法的功能组件的例证蜂窝电话机的方框图。图2是表示将“个性”下载到蜂窝电话机的进程的流程图。图3是表示用户如何配置蜂窝电话机,从而具有选择的“个性”的流程图。图4A和4B是表示具有定制个性的语音拨号器流程的流程图。图5A和5B是表示具有随意说话的南方人的定制个性的语音拨-->号器流程的另一例子的流程图。图6是可实现这里描述的功能性的例证蜂窝电话机的方框图。具体实施方式移动语音通信设备,比如蜂窝电话机以及其它的连网计算设备具有可被描述成具有特定个性的多模态界面。由于这些多模态界面几乎只是软件产品,因此能够向内部进程赋予个性。这些个性特征由设备的用户界面表明,并且可以是名人、或者政治家、喜剧演员、或者卡通人物。设备的用户界面包括提供音频提示的听觉界面,以及提供显示在设备显示器上的文本串的视觉界面。所述提示可用特殊的语音记录和重复,例如“Mickey Mouse”,“John F,Kennedy”,“Mr.T”等。提示也可被赋予特殊的口音,例如波士顿口音、印弟安口音或者南方口音。移动电话设备使用语音识别器电路,语音合成电路、逻辑、嵌入式数据结构和预先记录的提示的变化,脚本和图像来定义设备的个性,设备的个性又向多模态界面提供特殊的个性。这里描述的方法和设备目的在于提供多模态界面的定制,从而提供由移动通信设备表现的个性的定制。图1是图解说明用于这里说明的定制方法的功能组件的例证蜂窝电话机的方框图。系统10包括输入、输出、处理和数据库组件。蜂窝电话机使用音频系统18,音频系统18包括输出扬声器和/或头戴耳机20和输入麦克风22。音频输入设备或麦克风22接收用户的口头话语。输入麦克风22将接收的音频输入信号提供给语音识别器2。语音识别器包括声学模型34,声学模型34是每个音素的声学参数的概率表示。正是语音识别器识别用户输入(口头话语),并将识别的单词(文本)提供给发音模块14。发音模块再将输入提供给语音合成器12。识别的单词也作为文本串被提供给视觉显示设备。发音模块14建立输出信号的声学表示,并将该声学表示提供给语音识别器。发音模块14包括数据库,所述数据库其中存储有字母--->音素转换规则和/或特殊单词的清楚发音,可能还存储有语音修改规则。发音模块14的不同数据库中的数据可被改变,以反映用户界面表现的个性。例如,关于具有南方口音的个性的字母-音素转换规则不同于关于具有英国口音的个性的字母-音素转换规则,数据库可被更新,以反映为电话机选择的本文档来自技高网
...

【技术保护点】
一种移动语音通信设备,包括:发射和接收听觉信息和数据的无线收发器电路;处理器;和存储可执行指令的存储器,当在所述处理器上执行时,所述可执行指令使所述移动语音通信设备向所述移动语音通信设备的用户提供与所述设备相关的可选 个性,所述可执行指令包括在所述设备上实现采用具有至少一种可选个性的多个不同用户提示的用户界面,其中所述多个用户提示的每个可选个性被定义,并且被映射到存储在所述移动语音通信设备的至少一个数据库中的数据。

【技术特征摘要】
【国外来华专利技术】US 2004-2-17 60/545,2041、一种移动语音通信设备,包括:发射和接收听觉信息和数据的无线收发器电路;处理器;和存储可执行指令的存储器,当在所述处理器上执行时,所述可执行指令使所述移动语音通信设备向所述移动语音通信设备的用户提供与所述设备相关的可选个性,所述可执行指令包括在所述设备上实现采用具有至少一种可选个性的多个不同用户提示的用户界面,其中所述多个用户提示的每个可选个性被定义,并且被映射到存储在所述移动语音通信设备的至少一个数据库中的数据。2、按照权利要求1所述的移动语音通信设备,还包括:识别用户口头输入并提供识别的对应单词的解码器;和合成与所述识别的单词相对应的单词的语音合成器。3、按照权利要求2所述的移动语音通信设备,其中所述解码器包括语音识别引擎。4、按照权利要求1所述的移动语音通信设备,其中所述移动通信设备是移动电话机。5、按照权利要求1所述的移动语音通信设备,其中所述至少一个数据库包括发音数据库,合成器数据库和用户界面数据库之一。6、按照权利要求5所述的移动语音通信设备,其中所述发音数据库包括代表字母-音素转换规则,多个单词的清楚发音,以及语音修改规则至少之一的数据。7、按照权利要求5所述的移动语音通信设备,其中合成器数据库包括代表音素-声音转换规则,速度控制和音调控制至少之一的数据。8、按照权利要求5所述的移动语音通信设备,其中所述用户界面数据库包括代表预先记录的听觉提示,与听觉提示相关的文本,屏幕图像和动画脚本至少之一的数据。9、按照权利要求1所述的移动语音通信设备,其中所述收发器电路包括音频输入装置和音频输出装置。10、按照权利要求1所述的移动语音通信设备,其中每个可选个性包括独特的语音,口音,单词选择,语法结构和隐式包含至少之一。11、一种操作包含语音识别能力的通信设备的方法,所述...

【专利技术属性】
技术研发人员:丹尼尔L罗森迈克尔埃金顿威廉姆巴顿劳伦斯S吉利克
申请(专利权)人:语音信号科技公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1