具有语音接口的移动电话制造技术

技术编号:3659829 阅读:144 留言:0更新日期:2012-04-11 18:40
一种移动电子装置,其包括:    声音功能选择装置,用户可操作来选择第一语音识别模式或第二、不同的语音识别模式;和    处理器,可操作来根据由所述声音功能选择装置选择的模式,在接收的语音信号上执行语音识别,并且基于识别的接收的语音执行进一步的功能。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术通常涉及具有语音接口的电子装置。本专利技术特别用于(但不必限制于)具有电话功能的这样的装置。
技术介绍
比如移动电话和个人数字助理(PDA)的移动电子装置在全球流行,特别是当它们增加可以执行两者功能的特征和组合并进入市场时。在很多国家这种装置是普遍存在的,大多数的少年和青年都拥有它们并且它们作为数据存储装置、个人组织工具和/或特别是作为个人通信工具已经变得很重要。在这种移动装置和它们的用户之间主要使用的接口是触觉-视觉接口,其是类似于大多数个人计算机和其他装置使用的图形用户界面。对于大多数移动电话,这包括使用按键来操控(navigate one’s way)菜单序列。对于大多数PDA,可以使用触摸屏和接触笔来操控菜单序列。很多装置提供触摸屏和按键操纵。因此,使用通常的移动电话,如果用户想要呼叫一个其号码记录在电话中存储的电话本上的人,用户不得不至少执行下面的步骤,每一步骤都需要各自的按键操作进入电话本,查找目标人的记录的位置并且选择相应的电话号码。对于对每一步都不得不按相同或不同的按键一次或多次,这样的问题还不是很严重。问题在于,用户在整个操作过程中的每一步都必须注意屏幕,并且还可能注意按键。通常,对那些趋向在移动电子装置中使用的小屏幕和小文本,用户不得不比在屏幕和文本更大的情况更集中精神。因此,使用过程中屏幕的可见度和好的视线成为了使用这样的装置的基本要素。不幸的是,这种接口对于盲人或其他视力有损害的人来说并不容易使用。而且,对于大多数人来说更重要的是,这样的接口在一个人快速移动,摇晃得很厉害而无法集中精神在屏幕或其他问题,特别是在驾驶的时候使用是不便的或危险的。特别地,因为这种接口需要非常集中精神,在一些国家,驾驶时使用是违法的,或者很快将变为违法的。其他接口的使用也已知可能为着特定目的。例如在2003年7月24日公布的Hoffmann等的美国专利申请No.2003/0,139,922提及了用于使用短消息服务(SMS)将短消息语音控制的输入进移动电话的语音识别系统。另外,在2003年1月9日公布的Huh等的美国专利申请No.2003/0,008,680描述了用于移动电话的小型缩进站(docking station)系统,其中系统可以接收和识别语音指令并且将它们转换为用于指示移动电话的电子信号。该系统还可以提供可听声音提示来确认用户发出的指令。
技术实现思路
在本说明书以及权利要求中,术语“包括(comprises、comprising)”或者类似的术语意在表示非排他性的包括,因此,包括一系列组件的方法或设备并不仅仅包括那些组件,而且可能很好地包括其他没有列出的组件。根据本专利技术的一个方面,提供了一种电子装置。这个装置包括声音功能选择装置和处理器。用户可操作声音功能选择装置来选择第一语音识别模式或第二、不同的语音识别模式。可操作处理器来根据由声音功能选择装置选择的模式在接收的语音信号上执行语音识别,并且基于识别的接收语音执行进一步的功能。根据本专利技术的另一方面,提供了一种控制移动电子装置来执行所需功能的方法。这个方法包括接收从多个语音识别模式中对一个语音识别模式的选择以及接收语音信号。这个方法之后根据所选择的语音识别模式在接收的语音信号上执行语音识别。这个方法基于识别的接收语音执行进一步的功能。根据本专利技术的又一个方面,提供了用于控制移动电子装置来执行所需功能的计算机软件。该软件包括用于指示处理器的计算机代码工具。代码工具指示处理器接收作为从多个语音识别模式中对一个语音识别模式的选择的输入并接收语音信号。指示处理器来根据所选择的语音识别模式在接收的语音信号上执行语音识别。进一步指示处理器基于识别的接收语音执行进一步的功能。附图说明为了本专利技术可以被容易地理解和产生实际效果,现在将结合附图引用如所示的优选的非限制实施例,附图中图1是一方框图,示出了根据本专利技术的实施例的移动电话的组件;图2是一遵循某一模式中的语音识别的电话的显示页面的示意图;图3是一遵循另一模式中的语音识别的电话的显示页面的示意图;和图4是一涉及语音识别模式的选择和操作的流程图。具体实施例方式在附图中,在不同图中的相似的标号始终指示相似的组件。图1是一方框图,根据本专利技术实施例,以移动无线电话1的形式示出了电子装置的组件。无线电话1具有和处理器4连接来通信的射频通信单元2。以显示屏6和键区8的形式的标准输入接口也和处理器4连接来通信。处理器4包括具有关联的只读存储器(ROM)12的编码器/解码器10,只读存储器12存储用于对可能由无线电话1发射或接收的声音或者其他信号进行编码和解码的数据。处理器4还包括由公共数据和地址总线16连接到编码器/解码器10、关联的字符只读存储器(ROM)18、声学单元清单只读存储器(ROM)20、随机存取存储器(RAM)22、静态可编程存储器24和可拆卸SIM模块26的微处理器14。其中,静态可编程存储器24和SIM模块26每一个都可以存储选择的引入的文本消息和电话号码的电话本数据库。微处理器14具有连接到键区8、显示屏6、包括振动马达和相关驱动的提示模块28、麦克风30和扬声器32的端口。在本实施例中的麦克风30和扬声器32还形成部分在用户和电话1之间的接口。字符ROM 18存储用于解码或编码可能由通信单元2接收、在键区8输入的文本消息的代码。字符ROM 18和清单ROM 20都存储用于微处理器14的操作码(OC),在清单ROM 20中的OC用于自动语音识别(ASR)和文语转换(TTS)的合成。射频通信单元2是具有通用天线34的组合的接收器和发射器。通信单元2具有和天线34通过射频放大器38连接的收发器36。收发器36还和将通信单元2连接到处理器4的组合的调制器/解调器40连接。上述移动电话可在发出或接收电话呼叫、发送和接收SMS消息等方面作为标准的电话而操作。其不同在于用户接口。电话的处理器4可能操作为ASR引擎并且引导在由麦克风30接收并转换为电信号的语音上的自动语音识别。识别是基于存储在代码ROM 12中的合适软件的,将引入的信号和存储在清单ROM 20中的语音模型做比较。电话的处理器4还可以操作为TTS引擎并引导在接收的文本上的文语转换合成(例如作为SMS消息)或者从存储器项目中读出的文本(例如菜单标题或它的内容)。合成的语音信号通过扬声器32传送到用户。语音合成是基于存储在代码ROM 12中的合适软件的,与存储在清单ROM 20中的声学单元相关联。图1的电话具有多模式用户接口,结合显示屏6、键区8、和麦克风30一起使用的嵌入的ASR引擎以及和扬声器32一起使用的嵌入的TTS引擎,从而增强移动电话的可用性。用户能够通过显示屏6、键区8和ASR引擎中的任意一个输入数据和指令。电话能够通过显示屏6和TTS引擎中的任一个输出数据和消息。另外当电话用于电话呼叫时,可获得声音信号并将其通过麦克风30和扬声器32分别发射、接收和播放。图1的移动电话可操作在多种ASR模式和TTS模式。移动电话包括声音功能按键(通常放置在键区8)、语音识别功能和文语转换合成功能。用户使用声音功能按键来选择多个语音识别模式(在这个实施例中姓名识别、号码识别和指令识别)中所需的一个。电话根据所选语音模式以输入语音的语音识别为其方本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:岳东剑陈桂林俞振利祖漪清
申请(专利权)人:摩托罗拉公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1