当前位置: 首页 > 专利查询>英特尔公司专利>正文

自然机器会话方法和设备技术

技术编号:21477545 阅读:28 留言:0更新日期:2019-06-29 04:48
本文中公开了与口语对话系统相关联的设备、方法以及存储介质。在实施例中,用于与用户进行自然机器会话的设备可包括监听组件,用于检测表示会话的开始的关键字;对话引擎,用于在会话期间与用户进行会话;以及控制器,用于至少部分地基于会话的状态选择性地激活监听组件或对话组件中的一个或者导致监听组件或对话组件中的一个被激活,并且将控制传递到激活的监听组件或激活的对话引擎。可公开或要求保护其它实施例。

【技术实现步骤摘要】
自然机器会话方法和设备
本公开涉及计算、机器会话、以及人工智能的领域;并且具体地涉及与跟用户的自然机器会话相关联的设备和方法。
技术介绍
本文中所提供的背景描述用于总体地呈现本公开的上下文的目的。除非在本文中另有指示,本部分中描述的材料不是本申请中的权利要求的现有技术,并且不因为包含在本部分中而被承认为现有技术。随着集成电路、计算、人工智能、语音识别、以及其他相关的技术的发展,口语对话系统已经变得越来越流行。口语对话系统的示例包括,但不限于,来自苹果计算机(AppleComputer)的Siri、来自谷歌(Google)的GoogleHome、来自亚马逊(Amazon)的Echo、来自微软的Cortana等等。为了便携性,现今的口语对话系统中的许多由电池供电。为了延长电池寿命,典型地采用带魔术字策略的低功率总听(LowPowerAlwaysListening;LPAL)组件。LPAL组件运行只对一个“魔术”字或短语进行识别并响应的非常低功率的自动语音识别(ASR)引擎。在识别出“魔术”字或短语时,LPAL激活嵌入在口语对话引擎中的功能强大得多的ASR组件,以识别用户话语并且响应于用户话语。在操作期间,功能更强大的ASR组件比LPAL组件消耗更多的功率,因此在每次响应于用户话语之后关闭ASR组件。结果,在这个类型的系统中的用户在他们对系统发出的每个话语之前,必须使用这个魔术字/短语。然而,在合作的自然会话中,参与者给彼此机会来插话或者接对话,并且参与者不需要在每次他们交谈时呼叫彼此的名字以确保另一个人正在听。因此,现今的带有LPAL和魔术字策略的口语对话系统对许多用户来说是不自然的,并且恼人的。需要支持与用户的更自然的机器会话交互,同时保存电池的解决方案。附图简述通过下列结合附图的详细描述,将容易理解实施例。为了便于该描述,相同的附图标记指示相同的结构元件。在附图中,通过示例而非限制的方式说明实施例。图1是根据各个实施例的本公开的口语对话系统的简化框图。图2是根据各个实施例的口语对话系统的简化框图,其包括在会话开始之前的口语对话系统的组件的交互。图3示出的是根据各个实施例的口语对话系统的简化框图,其包括在会话期间的口语对话系统的组件的交互。图4示出的是根据各个实施例的口语对话系统的简化框图,其包括在会话结束处的口语对话系统的组件的交互。图5示出根据各个实施例的适用于实践本公开的各方面的计算系统。图6示出根据各个实施例的具有被配置成实践图1-4中所示的方法(的各方面)的指令的示例性计算机可读存储介质。具体实施方式本文中公开了与口语对话系统相关联的设备、方法以及存储介质。在实施例中,用于与用户进行自然机器会话的设备可包括监听组件,用于检测表示会话的开始的关键字;对话引擎,用于在会话期间与用户会话;以及被耦合到监听组件和对话引擎的控制器,用于至少部分地基于会话的状态选择性地激活监听组件或对话组件中的一个或者导致监听组件或对话组件中的一个被激活,并且将控制传递到激活的监听组件或激活的对话引擎。当监听组件和对话引擎中的一个被激活或导致被激活时,监听组件和对话引擎中的另一个被停用或导致被停用。在实施例中,用于与用户自然会话的机器实现方法可包括:在激活对话引擎后,由计算机设备的对话引擎设置对话引擎的定时器;在设置定时器后,由对话引擎与计算机设备的用户进行会话;以及在定时器期满后,由对话引擎将定时器的期满通知给计算机设备的控制器。响应于定时器的期满,控制器可激活监听组件或者导致监听组件被激活,并且停用对话引擎或者导致对话引擎被停用。这些和其他的方面将参考各附图在以下被进一步描述。如本领域的技术人员将领会的,从以下的描述,用于与用户进行机器会话的本公开的口语对话系统可通过只在人类将预期需要吸引他们的会话伙伴的注意时-会话的起始时以及在会话停止并且存在一段时间的会话不活动(但不在每次交互之前)之后恢复会话时,使用魔术字/短语来在模仿人与人的行为方面更好。结果,可实现更自然和更好的用户体验。在以下的描述中,参考形成本文一部分的附图,其中相同的标记指示全文中相同的部分,并且其中通过说明的方式示出了可以实践的实施例。应理解,可利用其它实施例并作出结构或逻辑改变而不背离本公开的范围。因此,不以限制意义作出以下详细描述,并且实施例的范围由所附权利要求及其等效方案来限定。可以按在理解要求保护的主题中最有帮助的方式轮流地将各方法的操作描述为多个分立动作或操作。然而,不应将描述的顺序解释为意味着这些操作必然依赖顺序。具体而言,可以不按照呈现的顺序执行这些操作。可以以不同于描述的实施例的顺序执行所描述的操作。在附加的实施例中,可以执行各种附加操作和/或可以省略、拆分或组合所描述的操作。对于本公开的目的,短语“A和/或B”意思是(A)、(B)或(A和B)。对于本公开的目的,短语“A、B和/或C”意思是(A)、(B)、(C)、(A和B)、(A和C)、(B和C)或(A、B和C)。说明书可使用短语“在实施例中”或“在多个实施例中”,其每一个可指代相同或不同实施例中的一个或多个。此外,相对于本公开的实施例使用的术语“包含”、“包括”、“具有”等同义。组件如下文(包括权利要求书)中所使用的,术语“模块”可指执行从多个编程指令生成的一个或多个软件或固件程序、组合逻辑电路和/或提供所描述功能的其他合适的组件的专用集成电路(ASIC)、电子电路、处理器(共享的、专用的或成组的)和/或存储器(共享的、专用的或成组的),或可以是上述各项的部分,或可包括上述各项。。现在参考图1,其中示出了示出根据各个实施例的本公开的口语对话系统的组件的简化框图。如所示的,口语对话系统100可包括如所示彼此耦合的对话引擎102、监听组件104、控制器(也被称为监听推理机)106、以及音频特征提取器108,。对话引擎102可被配置成与用户会话,具有理解用户的话语,以及可听地响应于用户话语的能力。另一方面,监听组件104可被配置成监听并理解表示会话的起始或开始的一个或多个(有限数量的)关键字或短语(也被称为魔术字或短语)。因此,当与监听组件104进行比较时,实现对话引擎102的电路或逻辑更复杂或精细,并且因此,在操作期间往往比监听组件104消耗更多的功率。控制器(也被称为监听推理机)102可被配置成至少部分地基于与用户的会话的状态选择性地激活对话引擎102和监听组件104/导致对话引擎102和监听组件104被激活,或者停用对话引擎102和监听组件104/导致对话引擎102和监听组件104被停用。更具体地,控制器102可被配置成在会话的起始或开始处激活对话引擎102/导致对话引擎102被激活,并且保持对话引擎102被激活直到会话结束,并且此后保持对话引擎102被停用。同时,控制器102可被配置成在会话结束处激活监听组件104/导致监听组件104被激活,并且保持监听组件104被激活直到另一会话开始,并且在新会话的开始后,保持监听组件104被停用。因此,用于与用户进行机器会话的口语对话系统100可通过只在人类将预期需要吸引他们的会话伙伴的注意时-会话的起始时以及在会话停止并且存在一段时间的会话不活动之后恢复会话时,使用魔术字/短语来在模仿人与人的行为方面更好。结果,可实现更本文档来自技高网...

【技术保护点】
1.一种用于与用户进行自然机器会话的设备,包括:监听组件,用于检测表示会话的开始的关键字;对话引擎,用于在所述会话期间与用户进行会话;以及控制器,所述控制器耦合到所述监听组件和所述对话引擎以至少部分地基于所述会话的状态选择性地激活所述监听组件或所述对话组件中的一个或者导致所述监听组件或所述对话组件中的一个被激活,并且将控制传递到所激活的监听组件或所激活的对话组件。

【技术特征摘要】
2017.07.27 US 15/661,9911.一种用于与用户进行自然机器会话的设备,包括:监听组件,用于检测表示会话的开始的关键字;对话引擎,用于在所述会话期间与用户进行会话;以及控制器,所述控制器耦合到所述监听组件和所述对话引擎以至少部分地基于所述会话的状态选择性地激活所述监听组件或所述对话组件中的一个或者导致所述监听组件或所述对话组件中的一个被激活,并且将控制传递到所激活的监听组件或所激活的对话组件。2.如权利要求1所述的设备,其特征在于,所述监听组件在其操作期间消耗比由所述对话引擎在其操作期间所消耗的功率少的功率。3.如权利要求1所述的设备,其特征在于,所述监听组件用于向所述控制器发送表示检测到所述关键字或所述会话的开始的会话状态指示符,或者所述对话引擎用于向所述控制器发送表示开始所述会话的期望的会话状态指示符。4.如权利要求3所述的设备,其特征在于,所述控制器用于在接收到表示检测到所述关键字或所述会话的开始的所述会话状态指示符或者接收到表示所述对话引擎开始所述会话的期望的所述会话状态指示符后,激活所述对话引擎或导致所述对话引擎被激活,并且将控制传递到所述对话引擎。5.如权利要求4所述的设备,其特征在于,所述控制器用于在接收到表示检测到所述关键字或所述会话的开始的所述会话状态指示符后,或在接收到表示开始所述会话的期望的所述会话状态指示符后,进一步停用所述监听组件或导致所述监听组件被停用。6.如权利要求4所述的设备,其特征在于,所述对话引擎用于在激活后设置定时器、识别用户话语,并且响应于所述用户话语。7.如权利要求6所述的设备,其特征在于,所述控制器用于在接收到指示所述会话的继续的会话状态指示符后,重置所述定时器或导致所述定时器被重置。8.如权利要求7所述的设备,其特征在于,所述对话引擎用于发送,并且所述控制器用于从所述对话引擎接收:表示所述对话引擎识别用户话语、所述对话引擎响应用户话语、或者所述对话引擎检测到继续会话特征的会话状态指示符。9.如权利要求6所述的设备,其特征在于,所述控制器用于在接收到表示所述会话的所述状态处于结束状态或所述定时器的期满的会话状态指示符后,激活所述监听组件或导致所述监听组件被激活,并且将控制传递到所述监听组件。10.如权利要求5所述的设备,其特征在于,所述对话引擎用于进一步检测会话结束特征,并且其中所述控制器用于在从所述对话引擎接收到表示检测到会话结束特征的会话状态指示符后,激活所述监听组件,并且将控制传递到所述监听组件。11.如权利要求1-8中的任一项所述的设备,其特征在于,所述控制器用于在接收到表示检测到所述会话的结束的会话状态指示符后,激活所述监听组件,并且将控制传递到所述监听组件。12.一种用于与用户进行自然会话的机器实现方法,包括:在对话引擎的激活后,由计算机设备的所述对话引擎设置所述对话引擎的定时器;在设置所述定时器后,由所述对话引擎与所述计算机设备的用户进行会话;以及在所述定时器期满后,由所述对话引擎将所述定时器的所述期满通知给所述计算机设备的控制器。13.如权利要求12所述的方法,进一步包括由所述计算机设备的监听组件将表示检测到关...

【专利技术属性】
技术研发人员:L·A·达尼尔斯卡S·C·尼基拉R·J·菲尔贝B·A·霍基
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1