当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理设备、信息处理方法和计算机程序技术

技术编号:5448807 阅读:154 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了信息处理设备、信息处理方法和计算机程序。提供了一种用于使用POMDP进行基础处理的设备和方法。设计配置以使得为了通过来自用户的话语理解来自用户的请求而使用POMDP(部分可观察马尔可夫决策过程)进行基础处理,其中,将从接收用户的话语并进行语言分析的语言分析单元获取的分析信息以及包括从进行任务的任务管理器获取的任务可行性信息的实体信息设置为观察信息。因此,可以有效地实现理解,并且可以提供对用户请求的高速准确的识别以及基于用户请求的任务执行。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及信息处理设备、信息处理方法和计算机程序,具体地,涉及应用于用于 通过例如用户与信息处理设备(例如电视机)之间的通信来执行处理的配置的信息处理方 法及计算机程序,更具体地,涉及其中信息处理设备分析来自用户的话语(Utterance)并 执行用户所请求的任务的配置。此外,本专利技术涉及执行基础处理(grounding process)以使系统使用POMDP (部分 可观察马尔可夫决策过程)来正确地识别用户的意图的信息处理设备、信息处理方法和计 算机程序。
技术介绍
例如,对于其中诸如电视机等的系统识别从用户输出的话语并在不使用遥控器的 情况下进行处理的配置,已经进行了各种研究。为了使系统理解用户的话语并进行正确的 处理,需要用户与系统之间的共识。例如,如果系统不能理解用户请求,则系统需要通过询问用户问题并使用来自用 户的回答正确理解用户的意图来解决该问题。为了与用户进行通信,系统主要进行以下两个处理响应于用户请求在系统内部进行的处理(例如,在系统为电视机的情况下,响应 于用户请求在系统内部进行的用于改变频道的处理)(称为“域任务”);以及用于通过会话实现系统和用户之间的相互理解的处理,其中在该会话中,如果系 统不能理解用户请求,则系统询问用户问题并使用回答(称为“会话任务”)。例如,在多人间的会谈中,将为使这多人相互理解所进行的处理称为“基础”。在该 基础中,需要进行下面的处理(1)用于确认是否已实现了相互理解的处理;以及(2)为了实现相互理解所进行的处理。(1)为了确认是否已实现了相互理解,需要用于确定是否已实现了理解的标准。例 如,需要理解的确信度或用于测量满意度的指标。另外,对于说话者和倾听者,标准的水平 需要相同。(2)在用于实现相互理解的处理中,也就是说,在基础处理中,重要的是对用于测 量用户和基础动作之间的会谈或通信的有效性的指标进行标准化。非专利文献 1 (作者为 David R. Traum 禾口 James F. Allen.的 A speechacts approach to grounding in conversation. In proceedings 2ndIηternational Conference on Spoken Langrage Processing(ICSLP-92), pages 137—40,1992 年 10 月) 说明了一种与用于实现相互理解的处理(即,基础处理)相关的现有技术。参考图1和2说明该非专利文献中所示的配置。如图1所示,例如,该非专利文献 说明了一种应用于在多人间进行的通信处理的状态变换结构。在通信处理中,如图1所示, 出现下面七个状态S.初始状态;1.紧接在开始之后的状态2.系统混乱状态;3.需要确认状态;4.用户混乱状态;F.基础状态;以及D.取消状态。在通信处理中,发生这七个状态间的变换。在非专利文献1中,如图2的表所示,定义与状态变换相对应的当前状态与使得发 生状态变换的动作之间的对应关系。图2表示当在当前状态下进行该表所示的下个动作时 (即,开始(I)到取消(R))可以变换成下个状态(S到D)。例如,在初始状态(S)下,动作发起者(发起人)进行某一动作。例如,第一用户 变成动作发起者,并且第一用户发出话语。在这种情况下,状态从(S)改变成“1”。此外,当 动作发起者(发起人)在状态(1)下继续发出话语时,状态持续为(1)或者从状态(1)改 变成状态⑷。如果状态改变成基础状态“F”,则确定正进行会谈的多人达到了相互理解状态。取 消“D”是这些用户未能达到相互理解的状态。在非专利文献1中,主要说明在通信中多人相互理解的处理,即,基础处理。对于 人和系统间的通信,这种相互理解处理(基础处理)也是必需的。也就是说,当用户请求系 统(例如电视机)进行处理时,用户和系统必须达到相互理解,以进行正确的处理。非专禾丨J文献 1 :David R. Traum 禾口 James F. Allen.的 A speech actsapproach to grounding in conversation. In proceedings 2nd InternationalConference on Spoken Langrage Processing(ICSLP-92),第 137-40 页,1992 年 10 月
技术实现思路
技术问题为解决上述问题,本专利技术的目的是提供一种使得系统在与用户的通信中实现相互 理解并有效进行正确处理的信息处理设备、信息处理方法和计算机程序。本专利技术的另一目的是提供一种使得解释来自用户的话语的诸如电视机等的系统 使用POMDP (部分可观察马尔可夫决策过程)来正确地识别用户的意图并进行处理的信息 处理设备、信息处理方法和计算机程序。技术方案根据本专利技术的第一方面,提供一种用于接收来自用户的话语并分析该话语的信息 处理设备。该信息处理设备的特征在于包括用户接口,该用户接口接收来自用户的话语并 进行语言分析;会话管理器,该会话管理器接收与通过用户接口输入的用户话语相关的信 息的识别结果,并通过使用部分可观察马尔可夫决策过程(POMDP)进行用于理解用户请求 的基础处理;以及任务管理器,该任务管理器基于与会话管理器所进行的基础处理的结果 相关的信息而执行任务。根据本专利技术的实施例,该信息处理设备的特征在于还包括显示器,其中,在由会话6管理器进行的基础处理期间,显示器为用户显示系统动作。根据本专利技术的另一实施例,该信息处理设备的特征在于,会话管理器具有配置以 使用POMDP进行基础处理,其中,将根据来自用户的话语生成的语义信息和基于包括由任 务管理器进行的任务的可行性的信息生成的实体信息设置为观察空间。根据本专利技术的另一实施例,该信息处理设备的特征在于,会话管理器具有配置以 使用POMDP进行基础处理,其中,将使用用作观察空间的语义信息计算出的状态值和使用 用作观察空间的实体信息计算出的状态值设置为状态空间。根据本专利技术的另一实施例,该信息处理设备的特征在于,会话管理器具有配置以 使用POMDP进行基础处理,其中,将使用用作观察空间的语义信息计算出的状态值、使用用 作观察空间的实体信息计算出的状态值、以及使用其它观察空间计算出的状态值设置为状 态空间。根据本专利技术的另一实施例,该信息处理设备的特征在于,会话管理器具有配置以 使用POMDP进行基础处理,其中POMDP具有以下配置其中基于包括使用用作观察空间的语 义信息计算出的状态值和使用用作观察空间的实体信息计算出的状态值的状态空间来计 算成本。根据本专利技术的另一实施例,该信息处理设备的特征在于,会话管理器具有配置以 使用POMDP进行基础处理,其中,将包括来自用户的话语的用户动作设置为观察空间。根据本专利技术的另一实施例,该信息处理设备的特征在于,会话管理器具有配置以 使用POMDP进行基础处理,其中,将使用用作观察空间的用户动作计算出的状态值设置为 状态空间。此外,根据本专利技术的第二方面,提供一种信息处理设备中使用的信息处理方法,其 中,该信息处理设备用于接收来自用户的话语并且分析该话语,该信息处理方法的特征在 于包括以下步骤语言输入和分析步骤,该语言输入和分析步骤通过使用用户接口接收本文档来自技高网
...

【技术保护点】
一种信息处理设备,所述信息处理设备用于接收来自用户的话语并分析所述话语,其特征在于包括:用户接口,所述用户接口接收来自用户的话语并进行语言分析;会话管理器,所述会话管理器接收与经由所述用户接口输入的用户话语相关的信息的识别结果,并通过使用部分可观察马尔可夫决策过程(POMDP)进行用于理解用户请求的基础处理;以及任务管理器,所述任务管理器基于与由所述会话管理器进行的所述基础处理的结果相关的信息来执行任务。

【技术特征摘要】
【国外来华专利技术】JP 2007-12-7 2007-317713;JP 2008-6-11 2008-153482;一种信息处理设备,所述信息处理设备用于接收来自用户的话语并分析所述话语,其特征在于包括用户接口,所述用户接口接收来自用户的话语并进行语言分析;会话管理器,所述会话管理器接收与经由所述用户接口输入的用户话语相关的信息的识别结果,并通过使用部分可观察马尔可夫决策过程(POMDP)进行用于理解用户请求的基础处理;以及任务管理器,所述任务管理器基于与由所述会话管理器进行的所述基础处理的结果相关的信息来执行任务。2.根据权利要求1所述的信息处理设备,其特征在于,还包括显示器,所述显示器在由所述会话管理器进行的所述基础处理期间为所述用户显示系 统动作。3.根据权利要求1所述的信息处理设备,其特征在于,所述会话管理器具有配置以使 用部分可观察马尔可夫决策过程进行基础处理,其中,将根据来自所述用户的话语而生成 的语义信息以及基于包括由所述任务管理器进行的任务的可行性的信息而生成的实体信 息设置为观察空间。4.根据权利要求3所述的信息处理设备,其特征在于,所述会话管理器具有配置以使 用部分可观察马尔可夫决策过程进行基础处理,其中,将使用用作所述观察空间的所述语 义信息而计算出的状态值以及使用用作所述观察空间的所述实体信息而计算出的状态值 设置为状态空间。5.根据权利要求3所述的信息处理设备,其特征在于,所述会话管理器具有配置以使 用部分可观察马尔可夫决策过程进行基础处理,其中,将使用用作所述观察空间的所述语 义信息而计算出的状态值、使用用作所述观察空间的所述实体信息而计算出的状态值、以 及使用其它观察空间而计算出的状态值设置为状态空间。6.根据权利要求3所述的信息处理设备,其特征在于,所述会话管理器具有配置以使 用部分可观察马尔可夫决策过程进行基础处理,其中,所述部分可观察马尔可夫决策过程 具有以下配置其中基于包括使用用作所述观察空间的所述语义信息而计算出的状态值和 使用用作所述观察空间的所述实体信息而计算出的状态值的状态空间来计算成本。7.根据权利要求1所述的信息处理设备,其特征在于,所述会话管理器具有配置以使 用部分可观察马尔可夫决策过程进行基础处理,其中,将包括来自所述用户的话语的用户 动作设置为观察空间。8.根据权利要求7所述的信息处理设备,其特征在于,所述会话管理器具有配置以使 用部分可观察马尔可夫决策过程进行基础处理,其中,将使用用作观察空间的所述用户动 作而计算出的状态值设置为状态空间。9.一种用于在信息处理设备中使用的信息处理方法,其中所述信息处理设备用于接收 来自用户的话语并分析所述话语,所述信息处理方法的特征在于包括语言输入和分析步骤,所述语言输入和分析步骤通过使用用户接口来接收来自用户的 话语并进行语言分析;会话管理步骤,所述会话管理步骤通过使用会话管理器,接收与经由所述用户接口输 入的用户话语相关的信息的识别结果,并使用部分可观察马尔可夫决策过程(POMDP)进行用于理解用户请求的基础处理;以及任务管理步骤,所述任务管理步骤通过使用任务管理器来基于与在所述会话管理步骤 中进行的所述基础处理的结果相关的信息而执行任务。10.根据权利要求...

【专利技术属性】
技术研发人员:迪普罗菲奥乌戈
申请(专利权)人:索尼公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利