当前位置: 首页 > 专利查询>谷歌公司专利>正文

确定热词适合度制造技术

技术编号:15508001 阅读:33 留言:0更新日期:2017-06-04 02:27
用于确定热词适合度的方法、系统和装置,包括在计算机存储介质上进行编码的计算机程序。一个方面,一种方法包括接收对用户所讲出的候选热词进行编码的语音数据;使用一种或多种预定准则对该语音数据或者候选热词的转录进行评估;使用一种或多种预定准则基于对该语音数据或候选热词的转录的评估而针对候选热词生成热词适合度分数;并且提供该热词适合度分数的表示以便向用户显示。

Determine the fitness of hot words

A method, system, and device for determining the suitability of a thermal word, including a computer program encoding on a computer storage medium. In one aspect, a method includes receiving the voice data candidate hot words say on the user's encoding; using one or more predetermined criteria of the voice data or candidate hot word transcription evaluation; the use of one or more predetermined criteria to assess the transcription of the voice data or candidate based on the hot words the candidates for the hot words generated hot words fit score; and provide a representation of the hot words fit fraction in order to display it to the user.

【技术实现步骤摘要】
确定热词适合度本申请为2015年2月13日进入中国国家阶段的、申请日为2013年7月1日的、名称为“确定热词适合度”的第201380043134.5号中国专利申请的分案申请。相关申请的交叉引用本申请要求于2012年7月3日提交的美国临时专利申请第61/667,817号以及于2012年8月6日提交的美国专利申请第13/567,572号的权益,这两个申请的通过引用全文结合于此。
本说明书涉及热词适合度的确定。
技术介绍
热词有时也被称作“关注词”或“唤醒词”,其为用户提供了与支持语音的计算设备开始交互的免提方式。当该计算设备检测到用户讲出热词时,该设备进入接收进一步的用户命令的准备状态。设备制造商和软件开发商通常提供供用户采用以便与其设备或软件应用进行交互的预定热词。
技术实现思路
根据该说明书中所描述的主题的一个创新方面,移动设备的用户可以定义其自己的热词以便由移动设备使用。候选热词能够被评估以例如确定该候选热词是否容易被设备与另一个词进行混淆,或者该候选热词是否不适合作为热词使用。该评估结果被显示给用户,用户随后可以确认其是否想要指定该候选热词作为热词,或者提交不同的候选热词进行评估。作为该说明书中所描述的主题的另一个创新方面,一种过程包括:接收对用户所讲出的候选热词进行编码的语音数据;使用一种或多种预定准则对该语音数据或者候选热词的转录进行评估;使用一种或多种预定准则,基于对该语音数据或该候选热词的转录的评估而针对该候选热词生成热词适合度分数;以及提供该热词适合度分数的表示以便向用户显示。这些方面的其它实施例包括相应的系统、装置以及在计算机存储设备上编码的计算机程序,其被配置为执行该方法的操作。这些和其它实施例可选地均可以包括以下一个或多个特征。例如,该热词适合度分数反映候选热词作为热词使用的适合度;热词是用于唤醒设备的关键词或关键短语;热词是用于解锁设备的关键词或关键短语;热词是语音密码;该语音数据从用户所操作的移动设备进行接收;生成热词适合度分数包括使用两个或更多预定准则,基于对该语音数据或者该候选热词的转录的评估而针对该预定准则中的每一个预定准则生成特征分数,对该特征分数进行汇总,并且输出经汇总的特征分数以作为热词适合度分数;评估该语音数据或候选热词的转录包括以帧为单位确定该语音数据的词长度,其中较长的词长度与较高的热词适合度分数相关联;评估该语音数据或候选热词的转录包括确定与候选热词相关联的音节或音素的数量,其中较大的音节或音素的数量与较高的热词适合度分数相关联;评估该语音数据或候选热词的转录包括确定该候选热词的转录和与该候选热词共享相同语言的一个或多个其它词之间的编辑距离,其中较小的编辑距离与较低的热词适合度分数相关联;评估该语音数据或候选热词的转录包括确定针对该候选热词规定的发音的数量,其中较少的发音的数量与较高的热词适合度分数相关联;评估该语音数据或候选热词的转录包括确定在该候选热词的转录中出现一个或多个特定音素;特定音素在该转录中的出现与较高的热词适合度分数相关联;特定音素在该转录中的出现与较低的热词适合度分数相关联;评估该语音数据或候选热词的转录包括确定语音识别器可用的热词的训练示例的数量,其中较小的训练示例的数量与较低的热词适合度分数相关联;评估该语音数据或候选热词的转录包括确定该候选热词的发音在用户对该候选热词的多个语音表达(utterance)中发生变化的程度,其中较大的程度与较低的热词适合度分数相关联;热词适合度分数的表示包括指示候选热词适合作为热词的数据;热词适合度分数的表示包括指示候选热词已经被接受作为热词的数据;热词适合度分数的表示包括热词适合度分数的经色彩编码的表示;和/或热词适合度分数的表示包括条(bar)、量计(gauge)或仪表。有利的实施方式可以包括以下一个或多个特征。在对热词进行评估时可以考虑与候选热词以及特定讲话者(例如,设备用户)相关的准则。可以对各种热词适合度准则进行计分并汇总,这确保了每个准则都被加以考虑,并且特定准则在热词评估过程期间不会占据主导。设备用户可以在为其设备选择热词时接收热词适合度分数以便做出知情决策。使用适当热词可以改进设备执行热词检测的能力,因此改善设备性能和用户体验。此外,使用适当热词可以限制出现“错误肯定”的热词检测而错误地激活设备的可能性,因此节省了设备资源。附图和以下的描述中给出了一种或多种实施方式的细节。其它可能的特征和优势将由于描述、附图和权利要求变得显而易见。附图说明图1和2是可以确定所讲出的热词的适合度的示例系统的示图。图3是图示用于确定所讲出的关键词并且用于提供适合度的表示的示例处理的流程图。图4示出了一般计算机设备和一般移动计算机设备的示例。各图中同样的附图标记和标注指示同样的元素。具体实施方式图1是可以确定所讲出的热词的适合度的示例系统100的示图。图1还图示了以阶段(A)至(H)所示的示例数据流。阶段(A)至(H)可以以所图示的顺序进行,或者它们可以以与所图示的顺序不同的顺序进行。通常,热词适合度可以由系统100作为热词指定处理的一部分来确定。热词可以包括用户所讲出的用于与静态、便携式或移动计算设备进行交互或者对它们进行控制的关键词或关键短语。例如,热词可以由用户讲出以发起与计算设备的通信,这通常将设备置于其可以接收另外的语音命令的状态。例如,在检测到所讲出的热词时,计算设备可以执行各种操作,包括激活(即,从休眠或空闲状态“唤醒”)、解锁、开启设备应用(例如,搜索应用、地图应用等)、加载优选用户设置和/或其它适当操作。设备用户可能想要选择特定的词或短语来用作其计算设备的热词。例如,对个人具有意义的词或短语可以用来对设备进行定制,可以以幽默的方式对设备进行个性化,并且与设备制造商所提供的词或短语相比用户更易于记住或发音。此外,用户所选择的热词可以提供安全措施,特别是用作密码。然而,一些词或短语与其它词或短语相比可能更容易被计算设备所检测,并且因此可以用作更好的热词。如以下示例中所描述的,热词的可检测性取决于与特定词或短语相关并且与特定讲话者相关的各种因素,诸如词或短语的长度、词或短语中所包括的音节或语音的数量、特定语音的出现、词或短语被识别的发音的数量、讲话者所讲出的词或短语发音的变化、来自各个其它讲话者的词或短语的训练示例的可用性以及所讲出的词或短语与共享语言的其它词或短语之间的编辑距离。每种准则可以进行打分、汇总并且向用户输出,因此提供候选热词的适合度的整体指示。例如,基于热词适合度分数,用户可以在为其设备选择热词时做出知情决策。更为详细地,系统100包括计算设备102(这里在各个操作阶段被示为计算设备102a、102b和102c),其能够呈现界面104(这里在各个操作阶段被示为界面104a、104b和104c)以便向用户显示。计算设备102包括一个或多个处理器,其被配置为执行由计算机可读介质所存储的用于执行诸如输入/输出、通信、数据处理等的各种设备操作的指令。例如,计算设备102可以包括一个或多个客户端计算设备(例如,台式计算机、膝上型计算机、笔记本计算机、导航系统、智能电话和或者其它适当计算设备)和/或可以包括一个或多个服务器(例如,后端服务器集群)。例如,客户端计算设备所接收的输入可以在本本文档来自技高网...
确定热词适合度

【技术保护点】
一种计算机实施的方法,包括:提供使用户讲出将被指定为定制热词的候选词语的提示用于输出,其中热词是这样一个词语,它向移动设备上的语音命令处理子系统指示紧接所述热词之后被语音表达的一个或多个词语将被作为语音命令来处理;响应于所述提示接收所述候选热词的一个或多个语音表达;以及响应于所述候选热词的所述一个或多个语音表达,提供所述候选热词是否已作为热词被接受的指示。

【技术特征摘要】
2012.07.03 US 61/667,817;2012.08.06 US 13/567,5721.一种计算机实施的方法,包括:提供使用户讲出将被指定为定制热词的候选词语的提示用于输出,其中热词是这样一个词语,它向移动设备上的语音命令处理子系统指示紧接所述热词之后被语音表达的一个或多个词语将被作为语音命令来处理;响应于所述提示接收所述候选热词的一个或多个语音表达;以及响应于所述候选热词的所述一个或多个语音表达,提供所述候选热词是否已作为热词被接受的指示。2.根据权利要求1所述的计算机实施的方法,其中提供所述候选热词是否已作为热词被接受的所述指示包括:响应于所述候选热词的所述一个或多个语音表达,提供所述候选热词已作为热词被接受的指示;以及其中在提供所述候选热词已作为热词被接受的所述指示之后,所述计算机实施的方法还包括:接收其后紧接有(ii)一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的语音表达;以及确定紧接已作为热词被接受的所述候选热词之后被语音表达的所述一个或多个词语的具体集合将被作为一个或多个语音命令来处理。3.根据权利要求2所述的计算机实施的方法,其中响应于所述提示接收所述候选热词的一个或多个语音表达包括:在所述移动设备处于激活状态的同时,响应于所述提示接收所述候选热词的一个或多个语音表达,以及其中接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达包括:在所述移动设备处于休眠或空闲状态的同时,接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达。4.根据权利要求2所述的计算机实施的方法,其中响应于所述提示接收所述候选热词的一个或多个语音表达包括:在所述移动设备被解锁的同时,响应于所述提示接收所述候选热词的一个或多个语音表达,以及其中接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达包括:在所述移动设备被解锁的同时,接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达。5.根据权利要求2所述的计算机实施的方法,还包括:在提供所述候选热词已作为热词被接受的所述指示之后,接收确认所述候选热词将被指定为定制热词的数据;其中接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达包括:在接收确认所述候选热词将被指定为定制热词的数据之后,接收(i)已作为热词被接受的所述候选热词的所述语音表达;以及其中确定紧接已作为热词被接受的所述候选热词之后被语音表达的所述一个或多个词语的具体集合将被作为一个或多个语音命令来处理包括:至少基于接收到确认所述候选热词将被指定为定制热词的数据,确定紧接已作为热词被接受的所述候选热词之后被语音表达的所述一个或多个词语的具体集合将被作为一个或多个语音命令来处理。6.根据权利要求5所述的计算机实施的方法,其中接收确认所述候选热词将被指定为定制热词的数据包括:响应于所述指示,接收指示被提供给所述移动设备的用户输入的数据。7.根据权利要求1所述的计算机实施的方法,其中提供所述候选热词是否已作为热词被接受的所述指示包括:响应于所述候选热词的所述一个或多个语音表达,提供(i)所述候选热词还未作为热词被接受的指示和(ii)使用户讲出将被指定为定制热词的另一不同候选词语的提示。8.根据权利要求1所述的计算机实施的方法,其中提供使用户讲出将被指定为定制热词的候选词语的所述提示用于输出包括:提供使所述用户讲出将被指定为定制热词的候选词语的提示用于由所述移动设备输出,以及其中响应于所述候选热词的所述一个或多个语音表达提供所述候选热词是否已作为热词被接受的所述指示包括:响应于所述候选热词的所述一个或多个语音表达,提供所述候选热词是否已作为热词被接受的指示用于由所述移动设备输出。9.根据权利要求1所述的计算机实施的方法,其中响应于所述候选热词的所述一个或多个语音表达提供所述候选热词是否已作为热词被接受的所述指示包括:响应于所述候选热词的所述一个或多个语音表达,提供置信度值是否已满足预定阈值的指示,所述置信度值反映所述候选热词表示适合的热词的置信水平。10.根据权利要求9所述的计算机实施的方法,还包括:响应于所述候选热词的所述一个或多个语音表达,提供所述置信度值的一个或多个图形或文本表示用于在所述移动设备上显示。11.一种在一个或多个非暂态计算机存储介质上被编码的计算机程序产品,包括在由一个或多个计算机执行时使得所述一个或多个计算机执行操作的指令,所述操作包括:提供使用户讲出将被指定为定制热词的候选词语的提示用于输出,其中热词是这样一个词语,它向移动设备上的语音命令处理子系统指示紧接所述热词之后被语音表达的一个或多个词语将被作为语音命令来处理;响应于所述提示接收所述候选热词的一个或多个语音表达;以及响应于所述候选热词的所述一个或多个语音表达,提供所述候选热词是否已作为热词被接受的指示。12.根据权利要求11所述的计算机程序产品,其中提供所述候选热词是否已作为热词被接受的所述指示包括:响应于所述候选热词的所述一个或多个语音表达,提供所述候选热词已作为热词被接受的指示;以及其中在提供所述候选热词已作为热词被接受的所述指示之后,所述操作还包括:接收其后紧接有(ii)一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的语音表达;以及确定紧接已作为热词被接受的所述候选热词之后被语音表达的所述一个或多个词语的具体集合将被作为一个或多个语音命令来处理。13.根据权利要求12所述的计算机程序产品,其中响应于所述提示接收所述候选热词的一个或多个语音表达包括:在所述移动设备处于激活状态的同时,响应于所述提示接收所述候选热词的一个或多个语音表达,以及其中接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达包括:在所述移动设备处于休眠或空闲状态的同时,接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达。14.根据权利要求12所述的计算机程序产品,其中响应于所述提示接收所述候选热词的一个或多个语音表达包括:在所述移动设备被解锁的同时,响应于所述提示接收所述候选热词的一个或多个语音表达,以及其中接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达包括:在所述移动设备被解锁的同时,接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被接受的所述候选热词的所述语音表达。15.根据权利要求12所述的计算机程序产品,所述操作还包括:在提供所述候选热词已作为热词被接受的所述指示之后,接收确认所述候选热词将被指定为定制热词的数据;其中接收其后紧接有(ii)所述一个或多个词语的具体集合的(i)已作为热词被...

【专利技术属性】
技术研发人员:A·E·鲁宾J·沙尔克威克M·C·P·桑马丁
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1