当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理装置、信息处理方法和程序制造方法及图纸

技术编号:19878361 阅读:20 留言:0更新日期:2018-12-22 17:58
在了在根据语音识别结果向用户提供处理结果中,期望提供一种能够增强给用户提供用户期望的处理结果的可能性的技术。本发明专利技术提供了一种信息处理装置,装配有:数据获取单元,其获取与由显示装置显示的显示信息相关的信息;以及呈现单元,当根据相关信息执行对关于语音识别结果的意图的解释时,所述呈现单元呈现基于意图解释的结果的处理结果。

【技术实现步骤摘要】
【国外来华专利技术】信息处理装置、信息处理方法和程序
本公开涉及信息处理装置、信息处理方法和程序。
技术介绍
近年来,已经存在这样的技术:当用户说话时,对用户话音执行语音识别处理,并向用户提供与通过执行语音识别处理获得的语音识别结果相对应的处理结果(例如,参见专利文献1)。引文列表专利文献专利文献1:JP2011-253375A
技术实现思路
技术问题但是,用户话音的意图可能视情况而定。因此,期望提供这样的技术,该技术可以增强当与语音识别结果相对应的处理结果被提供给用户时向用户提供用户期望的处理结果的可能性。问题的解决方案根据本公开,提供了一种信息处理装置,包括:数据获取部,被配置为获取与由显示装置显示的显示信息相关的相关信息;以及提供部,被配置为当根据相关信息解释语音识别结果的意图时,向用户提供基于意图解释结果的处理结果。根据本公开,提供了一种信息处理方法,包括:获取与由显示装置显示的显示信息相关的相关信息;以及当根据相关信息解释语音识别结果的意图时,通过处理器向用户提供基于意图解释结果的处理结果。根据本公开,提供了一种用于使计算机用作信息处理装置的程序,包括:数据获取部,被配置为获取与由显示装置显示的显示信息相关的相关信息;以及提供部,被配置为当根据相关信息解释语音识别结果的意图时,向用户提供基于意图解释结果的处理结果。专利技术的有益效果根据如上所述的本公开,提供了可以增强当向用户提供与语音识别结果相对应的处理结果时,用户期望的处理结果被提供给用户的可能性的技术。注意,上述效果不一定是限制性的。具有或代替上述效果,可以实现本说明书中描述的任何一种效果或可以从本说明书中理解的其他效果。附图说明图1是用于描述根据本公开的实施例的信息处理装置的概述的图。图2是用于描述根据该实施例的信息处理装置的概述的图。图3是示出代理的功能配置示例的图。图4是示出控制部的详细配置示例的图。图5是示出由PC代理的显示部显示的画面的示例的图。图6是用于描述产品被过滤的画面配置示例的图。图7是示出与情况相对应的意图解释的操作示例的序列图。图8是示出指示意图解释模式的信息的显示示例的图。图9是示出在根据情况解释意图的情况下的系统的配置示例的图。图10是示出根据用户是否正在观看显示信息的对话的操作示例的序列图。图11是示出EC画面的显示示例的图。图12是示出在一般EC站点上显示的搜索关键词显示区域的示例的图。图13是用于描述根据本公开的实施例的过滤辅助的图。图14是用于描述使用户话音更简单和更抗噪声的设计的图。图15是用于描述针对每条属性信息向用户提供候选列表的示例的图。图16是用于描述针对每条属性信息向用户提供与包括在第三语音识别结果中的属性信息相对应的候选列表中的所有内容的示例的图。图17是示出在用户话音包括有效词以及不包括有效词的每种情况下的操作示例的图。图18是示出在向用户提供候选列表的情况下的系统的配置示例的图。图19是示出与使用EC站点购买产品相关的代理的操作示例的流程图。图20是示出与使用EC站点购买产品相关的整个系统的操作示例的序列图。图21是示出通常用于搜索的屏幕的示例的图。图22是用于描述属性信息的选择示例的图。图23是示出与使用EC站点的音乐作品的分发相关的整个系统的操作示例的序列图。图24是用于描述分层地包括多条属性信息的情况的图。图25是示出搜索目标和与搜索目标相对应的属性信息的示例的图。图26是用于描述基于手动输入的搜索关键词进行搜索的情况的图。图27是图像信息示出加载时间的示例的图。图28是示出信息处理装置的硬件配置示例的框图。具体实施方式在下文中,将参照附图详细描述本专利技术的优选实施例(一个或多个)。注意,在本说明书和附图中,用相同的附图标记表示具有基本相同的功能和结构的结构元件,并且省略对这些结构元件的重复说明。注意,在本说明书和附图中,具有基本相同的功能和结构的结构元件有时在相同的附图标记之后使用不同的数字彼此区分。但是,当不需要特别区分具有基本相同的功能和结构的结构元件时,仅附上相同的附图标记。注意,将按以下顺序提供描述。1.本公开的实施例1.1.概述1.2.功能配置示例1.3.详细功能1.3.1.画面配置示例1.3.2.过滤产品时的对话示例1.3.3.过滤产品时的画面配置示例1.3.4.与情境相对应的意图解释1.3.5.根据显示信息是否被观看进行对话1.3.6.EC画面的显示示例1.3.7.过滤辅助技术1.3.8.属性信息的选择1.3.9.补充信息的公告1.4.硬件配置示例1.5.补充信息1.5.1.数学计算的修改细节1.5.2.补充事项11.5.3.补充事项21.5.4.补充事项31.5.5.补充事项41.5.6.补充事项51.5.7.补充事项61.5.8.补充事项71.5.9.补充事项81.5.10.补充事项91.5.11.补充事项101.5.12.补充事项11<1.本公开的实施例>[1.1.概述]首先,将参考附图描述根据本公开的实施例的信息处理装置的概述。图1和2是用于描述根据本公开的实施例的信息处理装置的概述的图。如图1和图2所示,本公开的实施例具有信息处理装置10和用户80。注意,本说明书主要假设信息处理装置10用作代理的情况(本说明书在某些情况下将信息处理装置称为代理)。这里,代理可以是接收用户的语音(下面也称为“用户话音”)作为语音信息,并向用户提供与针对该语音信息的语音识别结果相对应的处理结果的装置。代理10可以实现为个人计算机(PC)代理10-1,如图1所示。在图1所示的示例中,显示部150显示代理的角色图像Ch。或者,代理10也可以实现为机器人代理10-2,如图2所示。以下主要描述其中代理10由PC代理10-1实现的示例,但是还将根据需要描述代理10由机器人代理10-2实现的示例。近年来,在大多数情况下,难以使用诸如个人计算机(PC)和移动设备的电子设备的老年人期望允许任何人通过使用因特网容易地进行购物的技术。为了实现该技术,有必要提供允许用户在不操作困难的图形用户界面(GUI)等的情况下,通过用户和代理10之间的对话(特别是自然语言的对话)购买产品的服务,如图1和图2所示。例如,作为这样的服务,估计服务通常被成像,从而允许用户仅通过说“我想买大米”来购买目标大米。但是,事实上,在基于用户话音“我想买大米”进行搜索的情况下,找到了大量作为候选的“大米”。因此,为了购买目标大米,需要设定多种条件,诸如大米的种类、量、原产地和品牌。在图1和图2中所示的示例中,用户80说将关于“2kg”的量的条件添加到条件“大米”。像这个示例,不管一般图像如何,用户难以通过仅使用语音信息到达目标产品。因此,本说明书主要提出了使得能够通过将根据语音信息的操作与用于帮助选择目标产品的视觉信息结合来容易地选择和购买目标产品的技术。作为示例,在对某个电子商务(EC)站点进行使用关键词“大米”的搜索的情况下,找到了数千个候选作为搜索结果。也就是说,为了最终购买目标产品,用户必须将数千个候选过滤到目标产品(例如,一个候选)。具体地,用户必须基于指示用户希望购买的产品的主词(例如,诸如“大米”的产品的名称)来执行以下两种类型的工作中的任何一种。第一项工作包括设置诸如产品的重量、种类和品牌的各种本文档来自技高网...

【技术保护点】
1.一种信息处理装置,包括:数据获取部,被配置为获取与由显示装置显示的显示信息相关的相关信息;以及提供部,被配置为当根据相关信息解释语音识别结果的意图时,向用户提供基于意图解释结果的处理结果。

【技术特征摘要】
【国外来华专利技术】2016.05.12 US 62/335,4191.一种信息处理装置,包括:数据获取部,被配置为获取与由显示装置显示的显示信息相关的相关信息;以及提供部,被配置为当根据相关信息解释语音识别结果的意图时,向用户提供基于意图解释结果的处理结果。2.根据权利要求1所述的信息处理装置,其中显示信息包括与第一相关信息相关的第一显示信息以及与第二相关信息相关的第二显示信息中的至少一个,以及与第一相关信息相对应的意图解释结果不同于与不同于第一相关信息的第二相关信息相对应的意图解释结果。3.根据权利要求1所述的信息处理装置,其中当根据相关信息决定语音识别结果的意图解释模式时,提供部向用户提供指示意图解释模式的信息。4.根据权利要求3所述的信息处理装置,其中指示意图解释模式的信息包括角色图像、图标图像、背景图像以及BGM中的至少任何一个。5.根据权利要求1所述的信息处理装置,其中提供部将处理结果作为视觉信息以及语音信息中的至少一个提供给用户。6.根据权利要求5所述的信息处理装置,其中提供部在用户正在观看显示信息的情况和用户没有观看显示信息的情况之间向用户提供不同的语音信息。7.根据权利要求6所述的信息处理装置,其中与用户正在观看显示信息的情况相比,提供部在用户没有观看显示信息的情况下向用户提供更详细的语音信息。8.根据权利要求7所述的信息处理装置,其中在用户正在观看显示信息的情况下,提供部将处理结果作为至少视觉信息提供给用户,并在用户没有观看显示信息的情况下,提供部将与视觉信息相对应的语音信息作为详细的语音信息提供给用户。9.根据权利要求1所述的信息处理装置,其中当根据相关信息解释第一语音识别结果的意图时,数据获取部获取包括与意图解释结果中包括的第一输入词相对应的一个或多个候选词的候选列表,以及提供部基于所述候选列表向用户提供基于在第一语音识别结果之后获取的第二语音识别结果的意图解释结果的处理结果。10.根据权利要求9所述的信息处理装置,其中在第二语音识别结果中包括的第二输入词包括在候选列表中的情况下以及在关于第二输入词的处理的指令词不包括在第二语音识别结果中的情况下,提供部向用户提供基于与第二输入词相对应的意图解释结果的处理结果。11.根据权利要求9所述的信息处理装置,其中在第二语音...

【专利技术属性】
技术研发人员:长坂英夫
申请(专利权)人:索尼公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1