自动扩展移动通信设备的话音词汇的方法和装置制造方法及图纸

技术编号:3044799 阅读:195 留言:0更新日期:2012-04-11 18:40
一种用于提高语音识别器性能的方法,所述方法包括:为语音识别器提供词典;监测用户与网络的交互作用;访问多个与所监测的交互作用关联的词语;以及将所述多个词语包括在词典中。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及具有语音识别能力的移动通信设备。
技术介绍
现代移动通信设备(MCD)比传统单用途的移动语音电话提供 更多的功能。这些设备可以包括地址簿、日历、Web浏览器、数字音 乐播放器、电子邮件器、文本消息器、词语处理器、照相机,以及其 它应用。用户特定的对文本数据的选择通常是和这些应用的每一个相 关联的。例如,地址簿通常包含所述用户的联系方式的合适的人名, 而数字音乐播放器包括用户音乐釆集(collection)的音乐描述符,例 如艺术家和歌名。随着驻留在移动通信设备上的应用的数量增长,这 些文本数据的采集可能呈现为用户个人信息的日益增长的巨大主体。语音识别能力通常包含在这些设备中,用于命令和控制所述设 备,并作为用于一种或多种应用的输入形式。近来, 一些移动设备已 经包括了大词汇量(大约30, 000词语)的独立于说话者的语音识别 器,以使得用户能够执行语音到文本的消息传递。然而,这些语音识 别器的词汇是预定的,而且没有利用可驻留在移动设备上的用户的个 人信息的采集。
技术实现思路
通常,在一个方面中,本专利技术表征了一种提高语音识别器性能的 方法。该方法包括为语音识别器提供词典;监测用户与网络的交互 作用;访问多个与监测的交互作用关联的词语;以及基于多个词语中 的 一 个修改所述词典以提高所述语音识别器的性能。其它实施例包括一个或多个下述特征。所述语音识别器在移动设备上运行,而且对词语的访问包括从服务器将所述词语下载到移动设 备。所述语音识别器位于与网络连接的设备上。所述网络是数据网络, 例如互联网或电话网络。当所述网络是互联网时,监测用户与网络的交互作用的步骤包括监测用户与web浏览器的交互作用,以及访问 与用户与web浏览器的交互作用相关联的词语。从查询、搜索结果 和作为所述用户与Web浏览器交互作用的结果所访问的Web页面其 中的至少一个中获得所访问的词语。当用户与电话网络交互作用时, 所述设备监测所述用户经由电话网络与一个或多个其他方的话音通 信,访问与所述用户经由电话网络与一个或多个其他方的话音通信相 关联的词语。当从用户收到的输入时,以周期性间隔,或者当发生事 件时,动态地访问所述词语。所述设备以基于所访问词语在所监测的 交互作用中的出现频率的方式来偏置(bias)语音识别器。所述监测 的步骤还包括记录每个词语的分类,以及以基于所述多个词语中的 每一个的分类的方式来偏置语音识别器。所述监测的步骤进一步包 括记录所述多个词语中的每一个的使用上下文,以及以基于与所述 多个词语中的每一个相关联的使用上下文的方式来偏置语音识别器。一般地,在另一方面,本专利技术表征了一种实现在移动设备上的方 法。所述方法包括为语音识别器提供词典;监测用户与网络的交互 作用;捕获多个与监测的交互作用相关联的词语;以及将捕获的多个 词语添加到词典中。其它实施例包括一个或多个下述特征。监测用户与网络的交互作 用的步骤包括监测用户与Web浏览器的交互作用,以及捕获与用 户与Web浏览器的交互作用相关联的词语。通常,在另一方面中,本专利技术表征了一种在具有语音识别器的移 动设备上扩展语音词汇的方法。该方法包括在移动设备上为语音识 别器储存词典;在移动设备上储存多个词语,所述多个词语和移动用 户与驻留在移动设备上的Web浏览器的交互作用相关联;以及将多 个词语导入到词典中。在另一实施例,所述词语包括由移动用户输入 到浏览器的搜索项和由使用搜索项进行的搜索所返回的结果中包含 的词语。通常,在另一方面中,本专利技术表征了一种在具有语音识别器的移动设备上扩展语音词汇的方法,该方法包括在移动设备上为语音识 别器储存词典;所述词典包括第一多个词语;在移动设备上储存第二 多个词语,以及为所述第二多个词语中的每一个储存与所述词语关联 的使用上下文,所述第二多个词语与除了语音识别器之外的应用相关 联;以及将所述第二多个词语及其相关使用上下文导入到词典中。其它实施例包括一个或多个下述特征。所述第二多个词语中的至 少一个与适当名称的使用上下文关联。所述语音识别器被偏置为从所 述词典中选择如下候选词语,所述候选词语具有如下使用上下文,所 述使用上下文对应于将由所述语音识别器所识别的词语的使用上下 文。通常,在另一方面中,本专利技术表征了一种在具有语音识别器的移 动设备上扩展语音词汇的方法,该方法包括在移动设备上为语音识 别器储存词典,所述词典包括多个词语;在移动设备上储存第二多个 词语,所述文本词语的第二集合与除了语音识别器之外的应用相关 联;为所述第二多个词语中的每一个记录所述词语的使用频率;以及 将所述第二多个词语及其相关使用频率从储存的文本词语集合导入 到词典中。在另一实施例中,所述语音识别器至少部分基于候选词语 的使用频率从词典中选择候选词语。附图说明图l是具有语音识别能力的移动通信设备的框图。图2是示出当扩展语音词汇时的信息流程的移动通信设备的框图。图3是示出语音识别词汇扩展过程的步骤的流程图。 图4是示出当扩展语音词汇时的信息流的多用户移动通信设备 的框图。图5是连接到网络的通信设备的框图。图6是示出用于具有语音识别能力的移动通信设备的硬件平台 的高层的框图。具体实施方式具有语音识别能力的多功能MCD110的所选择的组件如图1所 示。所述设备包括应用102和104,每个应用使所述设备能够执行具 体的功能,例如,文本消息传送,在电话簿中查找联系方式。文本103 和105的采集和每一个应用关联。以适合于与文本采集相关的应用进 行访问的形式(例如在文本文件中,或在数据库中)存储所述文本采 集。当特定应用正在运行时,它将利用关联的文本采集中的词语或短 语。典型地,所述文本采集包括属于所述MCD拥有者个人的文本。 例如,与地址簿关联的文本采集包括用户的联系名称和其他联系信 息。以下给出其它示例。MCD100还包括语音识别器106。语音识别器106接收语音输入, 并且通过将它们和存储在语音到文本的词典108中的条目进行匹配来 尝试识别所说的词语。所述词典包括词语集合,每一个词语具有文本 表示和对应的发音。当识别出所说的词语时,所述语音识别器将所说 的词语传递到请求该输入的应用。所述词语可以表示对于所述应用的 命令或所述应用中的信息输入。MCD100包括用于扩大语音到文本的词典108的内容的机制,通 过分别从与应用102和104关联的文本采集103和105中导入词语来 运行所述机制。 一旦被合并到词典中,这些词语就扩展了语音识别器 106的词汇。所述添加的词汇可能是对用户的具体值,因为它包括用 户为与其它应用结合使用而选择的词语,并且因此它形成用户的个人 语言空间的一部分。受益于词汇的扩展,当用户使用与所述词语关联 的原始应用或MCD中的任意其它应用时,所述语音识别器可以识别 初始与所述应用中的任意一个关联的词语。此外,用户获得词汇的扩 展,而不需要手动将词语输入或下载词语到词典。图2示出在词汇扩展期间在MCD110中的信息流程。所述MCD将文本采集103、 105导入到语音到文本的词典108,如箭头203、 205 所示。在图3中进一步示出该过程。MCD100标识其驻留的文本采集 (步骤302) 。 MCD100已经获知制造商提供的应用,并使用由定本文档来自技高网...

【技术保护点】
一种用于提高语音识别器性能的方法,所述方法包括:    为语音识别器提供词典;    监测用户与网络的交互作用;    访问多个与所监测的交互作用相关联的词语;以及    基于所述多个词语中的至少一个来修改词典,以提高语音识别器的性能。

【技术特征摘要】
【国外来华专利技术】US 2005-2-3 60/649,8061、一种用于提高语音识别器性能的方法,所述方法包括为语音识别器提供词典;监测用户与网络的交互作用;访问多个与所监测的交互作用相关联的词语;以及基于所述多个词语中的至少一个来修改词典,以提高语音识别器的性能。2、 如权利要求l所述的方法,其中,所述语音识别器位于移动 设备上。3、 如权利要求2所述的方法,其中,访问的步骤包括将所述 多个词语从服务器下载到移动设备。4、 如权利要求l所述的方法,其中,所述语音识别器位于连接 到网络的设备上。5、 如权利要求4所述的方法,其中,所述网络为互联网。6、 如权利要求4所述的方法,其中,所述网络为电话网络。7、 如权利要求l所述的方法,其中,监测用户与网络的交互作 用的步骤包括监测用户与Web浏览器的交互作用,并且其中,所 访问的多个词语和用户与Web浏览器的交互作用相关联。8、 如权利要求7所述的方法,其中,从查询、搜索结果以及作 为用户与Web浏览器交互作用的结果所访问的Web页面里的至少一 个中获得所述多个词语。9、 如权利要求l所述的方法,其中,监测用户与网络的交互作 用的步骤包括监测所述用户经由电话网络与一个或多个其它方的话 音通信,并且其中,所访问的多个词语与所述用户经由电话网络与一个或多个其它方的话音通信相关联。10、 如权利要求l所述的方法,其中,访问的步骤包括动态访 问所述多个词语。11、 如权利要求l所述的方法,其中,访问的步骤包括以周期 性间隔访问所述多个词语。12、 如权利要求l所述的方法,其中,访问的步骤包括当从用 户接收到输入时访问所述多个词语。13、 如权利要求l所述的方法,其中,访问的步骤包括当发生 事件时访问所述多个词语。14、 如权利要求l所述的方法,其中,以基于所述多个词语中的 词语在所监测的交互作用中的出现频率的方式来偏置所述语音识别 器。15、 如权利要求l所述的方法,其中,监测的步骤进一步包括 记录所述多个词语中的每一个的分类,并且其中,以基于所述多个词 语中的每一个的分类的方式来偏置所述语音识别器。16、 如权利要求l所述的方法,其中,监测的步骤进一步包括 记录所迷多个词语中的每一个的使用上下文,并且其中,...

【专利技术属性】
技术研发人员:丹尼尔L罗森乔丹科恩艾里亚斯P贝拉基斯
申请(专利权)人:语音信号科技公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1