用于一种语音识别设备的训练或适配方法组成比例

技术编号:3047097 阅读:164 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及用于遵照一个电子设备的功能行事的一个语音识别设备的训练或适配,例如在一个移动电话中一个语音拨号的触发。为了构造语音识别设备训练和/或适配以便改善用户舒适性,提出具有下面步骤的一种方法:执行一个语音输入;处理由语音识别设备输入的语音以便产生一个语音识别结果;如果该语音识别结果能够被分配到电子设备的一个功能,遵照该电子设备的所分配的功能行事;如果遵照电子设备的所分配的功能行事不能导致一个表示拒绝的用户输入,以与完成的语音输入关联的语音识别结果为基础训练或适配该语音识别设备。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种用于一种用于遵照一个电子设备的功能行事的语音识别设备的训练或适配方法。
技术介绍
特别地,该电器设备是一个移动电话,其中语音拨号的性能与所实现的设备功能相一致,其中通过一个语音输入另一个用户被拨叫。当用在一个机动车辆中时在其中通常提供免提装置以进一步辅助用户,因为他不再执行键盘输入以触发对另一个用户的拨叫,用户的操作舒适性被改进。应用的其它领域包括诸如电视接收机,录像机,高保真音乐系统厨房设备或具有语音控制的其它设备的电子用户设备的控制,其中各种设备功能能够通过语音执行,例如音量控制,电视频道或无线电台的选择,或厨房设备的发动机转速的调整。一种语音识别设备能够被训练和/或适配,这样声音模型和相关的参数适合于新的词句、用户,并且如果必要的话,适合于周围的噪声和有关的麦克风位置。在这里,新入口被加到含有由声音模型表示的语音识别设备词汇的语音识别设备词典,或者已经存在的词汇入口被适配。在使用隐藏的马尔可夫模型(HMM)的语音识别设备中,隐藏的马尔可夫模型的蜕变概率和输出分布被调整。在训练期间,语音识别设备适应于一个还没有操作过该设备的用户的语音输入。这能由一个用户在该语音识别设备的第一次使用之前或者甚至更迟的在语音输入未被触发的第一次使用之后发生。利用以前的语音数据实行重新训练也是有可能的。训练性能的不同变量是已知的,其中,例如,分布混合的估计是在固定的HMM拓扑结构中或者同样该数量的一个变更或者HMM状态的转换中发生的。在语音识别设备的一个适配中,语音识别设备的预置参数被适配并被最佳化,其中在由一个用户完成的训练中该参数被预置或者以已经执行的适配处理为基础应用到那里;然而该参数也能够与用户无关地被预置。在于该用户的声音适配中,一个系统通过收集这个用户的特殊语音数据被改进,也就是在适配期间的误差率将降低。许多种适配方法是已知的,例如MAP(最大后验法),MLLR(最大似然线性回归),专用声音(这种方法目前只用在复杂的结构系统中)。同样除声音适配之外的适配形式是可能的;因此系统性能和这些数据的分析的改进能被实现,例如通过建立使用率统计(例如通过估计多久一条指令或电话号码被讲一次,并且结合它们所讲的内容)。US5,805,672公开了通过具有一个语音识别设备的辅助设备实现在机动车辆中移动电话设备的语音拨号功能的设备。当在机动车辆中使用时,一个免提装置被使用。如果需要语音拨号,则语音拨号模式必须首先被激活。该辅助设备然后通过语音识别设备识别在语音输入中已学过的单词,并给一个已识别的单词指定一个相关的电话号码,然后用户相关的发音被自动地拨叫。一种训练模式被提供,通过它的激活,被训练的语音识别设备能够被训练。这个训练模式由压下按键而被激活。在训练期间,用户被要求说出一个名字两次并输入相关的电话号码。接着用户按下一个确定键,在此之后该系统通过语音输出向该用户输出该语音识别结果(识别的名字)和相关的电话号码。该用户能够继续另一个名字的训练。WO00/14729公开了一种具有语音识别设备和语音拨号功能的移动电话。在这里也提供一种由开关操作起动的训练模式。在该训练模式期间,一个普通的训练操作被执行,其中通过新单词的输入扩展语音识别设备的词汇。
技术实现思路
本专利技术是基于设计该语音识别设备的训练和/或适配以便增加用户舒适性这个目的的。这个目的用最初描述的方法通过下列步骤实现-执行语音输入;-通过语音识别设备处理该语音输入以便产生一个语音识别结果;-如果该语音识别能被指配为该电子设备的一个功能,则完成该电子设备的指定功能;-如果对电子设备的指配功能的动作没有导致一个用户引起拒绝,则以与完成的语音输入相关连的语音识别结果为基础来训练或适应该语音识别设备。依靠根据本专利技术的的方法训练或适配不需要任何训练或适配模式的起动。甚至在训练或适应使用之前用户输入的确定也不是必需的。用于该训练或适配的语音输入和相关连的语音识别结果的适用性宁可通过以语音识别结果为基础的实际情况建立,一个可指配的设备功能通过例如运行语音拨号处理被激活,并且如果用户不给出一个具有他表示他的拒绝的输入,例如停止设备功能的执行(权利要求2),则它假设语音识别结果表示正确的语音输入并能被用作训练和适配。例如,用户也能通过语音或键盘输入表示其拒绝。权利要求3涉及一种在语音识别结果被用作训练或适配之前附加的安全措施,对于这个结果,倘若这里用户没有表示其拒绝,即使该语音识别结果不表示正确的语音输入,则一个训练操作或适配不以这个语音识别结果为基础而被执行。这个安全措施被设计为防止用户恰好被分散注意力并且由此不能表示其拒绝的情况,即使该语音识别结果是不能令人满意的,依据一个设备功能的想要的行为也不发生。权利要求4涉及在权利要求3中描述的安全措施防止以不令人满意的可靠性级别为基础的训练和适配的情况。如果,直接在语音输入之后通过例如键盘输入的另一种输入方法完成一个输入,这里前面的语音输入和通过其他输入方法完成的输入的一个高概率将发生。为了估计其一致性,考虑到检测没有发生的该语音输入和下面通过其他方法完成的输入的情况的一个可靠性级别同样被建立。如果该可靠性级别落在一个预定的目标范围内,一个训练操作和适配被考虑语音识别结果和通过其他输入方法完成的输入执行。权利要求5,象权利要求4一样,涉及一个语音输入最初没有被考虑适合于训练或适配,不过接下来的输入是通过另一种输入方法完成的以便再次有一个通过其他方法完成的输入和前面的语音输入的同时发生的较高概率的情况。对照权利要求4,权利要求5结合在一个语音输入之后,参照这个结果用户使一个输入表示其拒绝,出于这个原因,最初没有训练或适配发生的情况。这里在通过其他输入方法完成该输入之后的训练和适配之前,利用考虑到检测没有发生的该语音输入和下面通过其他方法完成的输入的情况的一个可靠性级别实施评估。在如权利要求6阐述的实施例中,对于每个语音识别结果至少一个可替换的语音识别结果被产生。如果,以最后的语音输入和相应的语音识别结果为基础,一个训练操作和适应被执行,如果最后之前的语音输入没有导致任何训练或适配,它同样检查是否该语音识别结果对应于一个对于最后之前的语音输入的可变更的语音识别结果的最后语音输入。如果是这种情况,它假定最后之前的语音输入和最后的语音输入彼此对应。在随后的额外训练操作或随后的额外适配中,语音识别设备的参数被以这样一种方式设定,最后之前的语音输入和最后的语音输入都将在新的输入操作中导致正确的语音识别结果,也就是导致对于最后的语音输入是确定的的语音识别结果。在如权利要求7阐述的实施例中,一个用户在听觉上或视觉上被通知一个语音识别结果。因此,在语音识别结果的准确度评定中,这个用户不仅仅参考一个设备功能的性能的识别。当设备功能的性能对于该用户是不可见的,或者他仅仅被给出关于由该语音识别设备产生的语音识别结果的不完全信息的时候,用户需要额外的信息。权利要求8和9涉及本专利技术在一个移动电话中的应用。在这里,该语音识别设备特别地用于语音拨号。权利要求10涉及一种用于实现根据本专利技术的方法的电子设备。在权利要求11中,该电子设备采用移动电话终端的形式。附图说明参考附图中所示的实施例的例子本专利技术将被做进一步描述,然而,本专利技术不受此限制。图1示本文档来自技高网
...

【技术保护点】
一种用于遵照一个电子设备(1)的功能行事的一个语音识别设备(4)的训练或适配的方法,其中提供下列步骤: 执行一个语音输入; 处理由语音识别设备(4)输入的语音以便产生一个语音识别结果; 如果该语音识别结果能够被分配给电子设备(1)的一个功能,遵照该电子设备(1)的所分配的功能行事; 如果遵照电子设备(1)的所分配的功能行事不能导致一个表示拒绝的用户输入,以与完成的语音输入关联的语音识别结果为基础训练或适配该语音识别设备(4)。

【技术特征摘要】
DE 2001-5-11 10122828.71.一种用于遵照一个电子设备(1)的功能行事的一个语音识别设备(4)的训练或适配的方法,其中提供下列步骤执于一个语音输入;处理由语音识别设备(4)输入的语音以便产生一个语音识别结果;如果该语音识别结果能够被分配给电子设备(1)的一个功能,遵照该电子设备(1)的所分配的功能行事;如果遵照电子设备(1)的所分配的功能行事不能导致一个表示拒绝的用户输入,以与完成的语音输入关联的语音识别结果为基础训练或适配该语音识别设备(4)。2.如权利要求1所述的方法,其特征在于,如果电子设备(1)的功能的的运行没有被一个用户输入中断,语音识别设备(4)的训练和适配发生。3.如权利要求1或2所述的方法,其特征在于,对于该语音识别设备(4)的一个语音识别结果,一个可靠性级别被确定,并且如果该语音识别结果的可靠性级别落在一个预定的目标范围内,以对应于该完成的语音输入的语音识别结果为基础执行该语音识别设备(4)的一个训练或适配。4.如权利要求1或2所述的方法,其特征在于,对于一个语音识别设备(4)的语音识别结果来说,确定一个最初的可靠性级别;如果该语音识别结果的最初的可靠性级别落在一个预定的目标范围内,以对应于该完成的语音输入的语音识别结果为基础执行该语音识别设备的(4)的训练或适配,如果这个初始的可靠性级别没有落在一个最初指定的目标范围内,并且同样如果通过另一种输入方法完成随后的用户输入,则考虑到通过其它输入方法完成的输入,它提供一个对于该语音识别结果被确定的第二可靠性级别,并且如果这个第二可靠性级别落在一个第二指定的目标范围内,以考虑到通过另一种输入方法完成的用户输入的语音识别结果为基础执行训练操作或适配。5.如权利要求1或2所述的方法,其特征在于,如果在一个语音输入之后进行一个表示拒绝该语音识别结果的用户输入,并且随后地通过另一种输入方法完成一个用户输入,则考虑到通过其它输入方法完成的输入,它提供对于该语音识别结果被确定的第二可靠性级别,并且执行语音识别设备(4)的训练操作或适配,提供语音输入和表示该相同的词语或词语序列的通过其它输入方法完成...

【专利技术属性】
技术研发人员:V施泰恩比斯T埃塞勒
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1