【技术实现步骤摘要】
本专利技术涉及用于辨识和解释口述的输入的自动化电子系统和方法。
技术介绍
在许多情形中,语音是用于对电子装置提供输入的优选机制。特定来说,口述的输入可有用于经由屏幕、键盘、鼠标或需要物理操纵和/或查看显示屏的其它输入装置与电子装置交互可能较困难或不安全的情形。举例来说,在驾驶交通工具时,用户可能希望对移动装置(例如智能电话)或基于汽车的导航系统提供输入,且可发现对装置说话是提供信息、输入数据或控制装置的操作的最有效方式。在其它情形中,用户可能发现提供口述的输入是方便的,因为他或她对较为接近地模仿与另一人的交互的对话界面感觉到更舒适。举例来说,用户可能希望在与如2011年I月10日申请的第12/987,982号美国技术专利申请案“智能自动化助理(Intelligent Automated Assistant) ”中描述的智能自动化助理交互时提供口述的输入,所述申请案以引用方式并入本文。语音辨识可用于许多不同情境中。举例来说,一些电子系统提供基于话音的用户接口,其允许用户经由口述的输入来控制装置的操作。语音辨识还可用于交互式话音辨识(IVR)电话系统,其中用户可导览选项菜单且可提供输入以例如购买飞机票、查看电影时间等等。语音辨识还用于许多形式的数据输入,包含经由文字处理器的写入。各种已知技术可用于解释口述的输入且将其转换为文本。声学建模可用于产生形成个别单词或短语的声音或音素的统计学表示。可将音频输入与这些统计学表示进行比较以作出哪些单词或短语是想要的确定。在许多系统中,以某种方式界定有限的词汇表,以便增加成功匹配的可能性。在一些系统中,语言建模可用以帮助预 ...
【技术保护点】
一种用于产生语音辨识结果的经合并列表的计算机实施的方法,其包括:在处理器处,接收口述的输入的候选解释的列表;在所述处理器处,从所述接收的列表形成记号网格,所述网格被组织为多个行和多个列;在所述处理器处,基于时序信息将所述网格分裂成列群组集合,每一列群组包括多个记号群组,每一记号群组包括至少一个记号;在所述处理器处,响应于在所述网格中检测到重复的记号群组,移除所述重复的记号群组以产生经合并网格;以及基于所述经合并网格而致使输出装置输出所述候选解释。
【技术特征摘要】
2011.09.20 US 13/236,9421.一种用于产生语音辨识结果的经合并列表的计算机实施的方法,其包括: 在处理器处,接收口述的输入的候选解释的列表; 在所述处理器处,从所述接收的列表形成记号网格,所述网格被组织为多个行和多个列; 在所述处理器处,基于时序信息将所述网格分裂成列群组集合,每一列群组包括多个记号群组,每一记号群组包括至少一个记号; 在所述处理器处,响应于在所述网格中检测到重复的记号群组,移除所述重复的记号群组以产生经合并网格;以及 基于所述经合并网格而致使输出装置输出所述候选解释。2.根据权利要求1所述的计算机实施的方法,其中所述接收的列表中的每一候选解释包括多个记号,且其中从所述接收的列表形成记号网格包括: 在所述处理器处,针对每一候选解释中的每一记号,确定开始时间和结束时间; 在所述处理器处,从所述确定的开始时间和结束时间形成唯一整数集合; 在所述处理器处,形成包括对应于所述接收的列表中的候选解释的数目的若干行的网格,每一行包括对应于所述唯一整数集合中的唯一整数的数目的若干单元,所述单元被组织为若干列;以及 在所述处理器处,将每一记号插入由所述记号的所述开始时间和结束时间所跨越的所有单元中。3.根据权利要求1所述的计算机实施的方法,其中所述接收的列表中的每一候选解释包括与开始时间和结束时间相关联的多个记号,且其中所述网格的每一列与开始时间和结束时间相关联,且其中基于时序信息将所述网格分裂成列群组集合包括: 在所述处理器处,针对所述网格中的每一列: 响应于所述列并未已属于列群组,形成包含当前列的列群组; 针对所述列中的每一记号,确定所述列中的任何记号是否与跨越超过所述列的所述结束时间的结束时间相关联;以及 响应于所述列中的任一记号跨越超过所述列的所述结束时间,将下一列添加到包含所述当前列的所述列群组。4.根据权利要求1所述的计算机实施的方法,其中移除所述重复的记号群组以形成候选解释的所述经合并网格包括: 在所述处理器处,界定多个记号短语,每一记号短语包括出现在列群组的一行内的至少一个记号;以及 针对所述网格中的每一列群组: 确定任何记号短语是否在所述列群组内重复;以及 响应于任何记号短语是重复的,删除重复项。5.根据权利要求1到4中任一权利要求所述的计算机实施的方法,其进一步包括: 在所述处理器处,响应于任何边缘记号是在于所有其记号短语中具有至少两个记号的列群组内的记号短语之间共享,将所述列群组分裂成包括所述共享的边缘记号的第一列群组和包括所述记号短语中的至少一个剩余记号的第二列群组。6.根据权利要求1到4中任一权利要求所述的计算机实施的方法,其进一步包括:在所述处理器处,针对在所有其记号短语中具有至少两个记号的每一列群组: 响应于任何记号出现在所述列群组中的所有记号短语的开始处,将所述列群组分裂为包括第一记号的第一列群组和包括所述记号短语中的至少一个剩余记号的第二列群组;以及 响应于任何记号出现在所述列群组中的所有记号短语的结束处,将所述列群组分裂为包括最后一个记号的第一列群组和包括所述记号短语中的至少一个剩余记号的第二列群组。7.根据权利要求1到4中任一权利 要求所述的计算机实施的方法,其进一步包括: 在所述处理器处,响应于任一列群组具有超过预定阈值的记号短语数目: 移除至少一个记号短语;以及 重复所述分裂所述网格和移除重复项的步骤。8.根据权利要求1到4中任一权利要求所述的计算机实施的方法,其中接收口述的输入的候选解释的所述列表包括: 在所述处理器处,接收多个经记号化的候选解释,每一候选解释包括多个记号;以及 在所述处理器处,接收每一记号的时序信息。9.根据权利要求1到4中任一权利要求所述的计算机实施的方法,其中候选解释的所述经合并网格包括: 至少一个具有单个记号群组的列群组;以及 至少一个具有多个记号群组的列群组。10.根据权利要求9所述的计算机实施的方法,其中致使所述输出装置输出所述候选解释包括: 针对每一列群组: 响应于所述列群组包括单个记号群组,致使所述输出装置在所述输出装置上显示所述单个记号群组;以及 响应于所述列群组包括多个记号群组,...
【专利技术属性】
技术研发人员:马尔切洛·巴斯泰亚福特,大卫·A·维纳斯凯,
申请(专利权)人:苹果公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。