管理用于输入理解确定的用户交互制造技术

技术编号:16112555 阅读:34 留言:0更新日期:2017-08-30 05:54
本公开的示例改进针对输入理解做出的决策,以辅助确定如何对输入最好地进行响应。使用输入识别组件、输入理解组件以及输入上下文组件来分析接收到的输入。确定潜在的响应选项。如果存在关于对接收到的输入进行响应的不确定性,则针对潜在的响应选项,生成不确定性值和误分类成本,以辅助做出关于如何对接收到的输入最好地进行响应的决策。针对潜在响应和与潜在响应相关联的参数来确定不确定性值,并且如果潜在响应证明是不正确的,则误分类成本是与寻求潜在响应相关联的成本。基于分析针对潜在响应的所生成的不确定性值和所生成的误分类成本,响应被选择以传输到用户。

【技术实现步骤摘要】
【国外来华专利技术】管理用于输入理解确定的用户交互
技术介绍
输入理解系统必须平衡从用户寻找澄清与基于给定时间点的系统的当前最好可信度采取动作之间的折中。寻找用于用户的查询/命令的确认或澄清使得系统能够确保准确地推断用户意图。如果系统重复地使得用户确认或澄清,则系统存在疏远用户的风险。然而,省略确认/澄清步骤可能导致关于用户意图以及其他可用性问题的评估的准确性的下降。其关于本公开所涉及的该总体技术环境。
技术实现思路
本公开的示例改进针对输入理解做出的决策,以辅助确定如何对用户输入最好地进行响应。使用输入识别组件、输入理解组件以及输入上下文组件来分析接收到的输入。确定潜在的响应选项。如果存在关于对接收到的输入进行响应的不确定性,则针对潜在的响应选项,生成不确定性值和误分类成本,以辅助做出关于如何对接收到的输入最好地进行响应的决策。针对潜在响应和关联于潜在响应的参数来确定不确定性值,并且如果潜在响应证明是不正确的,则误分类成本是与寻求潜在响应相关联的成本。基于分析针对潜在响应的所生成的不确定性值和的所生成的误分类成本,响应被选择以传输到用户。提供该概述以引入以在详细描述中下文进一步描述的简化形式的概念的选择。该概述不旨在标识所要求保护的主题的关键特征或基本特征,其也不旨在被用于限制所要求保护的主题的范围。示例的附加方面、特征和/或优点将在以下描述中部分被阐述并且部分从描述将是明显的或者可以通过本公开的实践被学习。附图说明参考以下附图描述非限制性和非排他性的示例。图1图示了用于输入评估和响应的示例系统的概述。图2图示了由输入理解平台造成的输入处理的示例方法。图3图示了多个输入的输入处理的示例方法。图4A图示了确定对接收到的输入的响应的示例方法。图4B图示了用于包括澄清/确认的响应生成的示例方法。图5是图示利用其可以实践本公开的各方面的计算设备的示例的块图。图6A和图6B是利用其可以实践本公开的各方面的移动计算设备的简化块图。图7是在其中可以实践本公开的各方面的分布式计算系统的简化块图。具体实施方式本公开描述了改进针对输入理解系统做出的决策以辅助输入理解系统确定如何对用户输入最好地进行响应的示例。在此所描述的示例平衡基于关于用户意图的系统或组件的当前可信度执行动作与在执行动作之前请求来自用户的澄清/确认之间的折中。输入理解系统(诸如会话理解(CU)系统)可能在其开始解译用户输入时面对不确定性。这样的系统易发生来自各种来源的错误(例如,语音识别错误、用户意图中的模糊、会话中的话题转移、系统无能力解析由用户所提到的实体等)。在面对这样的不确定性时,存在可用于系统的两个选择:1)系统可以或者利用其对于用户意图的最好猜想执行动作,因此存在可能采取不正确动作的风险,或者2)系统可以请求澄清/确认/消歧以移除/减少其不确定性,因此存在由于任务完成中的延迟和对于频繁重复的需要而疏远用户的风险。在所呈现的示例中,与用户输入确定有关的各个方面可以被评估以改进对输入理解系统的处理。作为示例,与可以被评估的输入理解确定有关的各个方面包括:1)意图的误分类成本;以及2)给定时间点的输入理解系统的置信度。如所描述的输入确定方面的评估可以改进在确定对用户输入的恰当响应时的准确性。例如,系统可以更好地被通知以确定是否需要寻找来自用户的进一步的澄清或者基于现有的可用信息执行动作。当处理用户输入时,这提高任务完成的效率,例如,减少错误率以及提供增强的用户体验(例如,增强可靠性、改进可用性等)。图1图示了用于输入评估和响应的示例系统的概述。示例性系统100是交互以形成用于输入理解和处理的执行的集成整体的相互依存组件的组合。系统100的组件可以是硬件组件或被实现在系统100的硬件组件上的软件。系统100的每个组件可以包括一个或多个系统组件。在一些示例中,系统100可以是在具有处理器的设备(例如,处理设备)上运行软件组件的应用或服务。例如,输入理解应用或服务可以被运行在处理设备(诸如计算机、移动电话、平板电脑、游戏控制台、电子设备等)上,其中系统的组件可以被执行在处理设备上。在其他示例中,系统100的组件可以跨越多个设备散布。例如,可以在客户端设备上录入输入,并且可以被处理或者从网络中的其他设备(诸如服务器设备和/或数据存储装置)访问信息。对于可以被包括为系统100的一部分的硬件的附加示例,请参考图5至图7。作为一个示例,系统100可以包括组件(诸如用户交互组件102)和包括组件(诸如输入识别组件106、输入理解组件108、输入上下文组件110、用户交互中介组件112、知识存储库114和动作成本存储库116)的输入理解平台104。然而,系统100不限于这样的示例。系统(诸如系统100)的规模可以变化并且包括比图1中所描绘的那些更多或更少的组件。用户交互组件102与系统(诸如输入理解平台104)的其他组件之间的交互可以通过将系统100的组件和系统100外部的资源进行连接的网络发生。在一个示例中,系统100的组件可以通过分布式环境(诸如云计算环境)进行连接。系统100的组件与处理设备的操作系统(OS)进行对接以允许输入理解和处理。例如,系统100可以从用户交互组件102(下面所描述的)接收输入,并且处理接收到的输入并且经由输入理解平台104(下面所描述的)将响应返回给用户。在一个示例中,系统可以是输入理解系统(诸如会话理解(CU)系统)。然而,系统100具有处理装置并且可以被配置为处理任何类型的输入,包括但不限于语音/声音输入、文本输入、姿态输入、手写输入等。在一个示例中,系统100可以操作为智能个人助理。智能个人助理是移动软件代理,其可以基于用户输入、位置意识和访问来自各种在线来源的信息的能力来执行针对个体的任务或服务。系统100可以操作的智能个人助理的示例包括但不限于SILVIA、S-Voice、VoiceMate、GoogleNow、Cortana、Hidi和Siri等。系统100可以经由用户输入交互组件102接收输入。用户交互组件102是使得以输入的形式的信息/数据能够录入系统100中并且允许系统100与用户通信或交互的组件。作为示例,用户交互组件102可以使得用户能够录入待被分析和处理的输入。如上文所标识的,输入可以以任何形式,包括语音/声音输入、文本输入、姿态输入和手写输入等。用户交互组件102可以与处理设备的OS进行对接以向用户提供用户接口来将输入录入系统100中。作为示例,在对于来自用户的输入条目的请求时,用户交互组件102可以显示提示。可以由采取动作(例如,点击图标、按压按钮、做出口头请求、做姿态等)的用户发起用户输入提示。在备选示例中,对于用户输入的提示可以被显示在用于用户录入输入的OS上。用户交互组件102可以与OS的组件进行对接。例如,控制设备、显示设备、耳机、移动设备(例如,启用WIFI、红外线或蓝牙的)、输入面板(例如,软输入面板、语音输入面板)、其他电子设备等可以与用户输入组件102协调用来培养用户交互。用户交互组件102还可以与系统100的其他组件(诸如输入理解平台104)进行对接。输入理解平台104是被用于处理接收到的输入的组件的集合。下面更详细地描述了输入理解平台104。用户交互组件可以将接收到的输入传递到输入理解平台104的组件本文档来自技高网...
管理用于输入理解确定的用户交互

【技术保护点】
一种系统,包括:存储器;以及至少一个处理器,其与所述存储器相连接并且被配置为执行针对输入理解平台的组件的处理,所述输入理解平台包括:用户交互中介组件,其用于:当所述系统不确定对输入的响应时,评估针对所述输入的潜在响应选项,其中所述用户交互中介组件基于以下各项来评估所述潜在响应选项:与潜在响应选项以及所述潜在响应选项的参数相关联的不确定性值,以及在潜在响应选项证明是不正确的情况下寻求所述潜在响应选项的误分类成本,以及基于评估针对所述潜在响应选项的所述不确定性值和所述误分类成本,从所述潜在响应选项选择响应以传输到所述用户。

【技术特征摘要】
【国外来华专利技术】2015.01.07 US 14/591,6031.一种系统,包括:存储器;以及至少一个处理器,其与所述存储器相连接并且被配置为执行针对输入理解平台的组件的处理,所述输入理解平台包括:用户交互中介组件,其用于:当所述系统不确定对输入的响应时,评估针对所述输入的潜在响应选项,其中所述用户交互中介组件基于以下各项来评估所述潜在响应选项:与潜在响应选项以及所述潜在响应选项的参数相关联的不确定性值,以及在潜在响应选项证明是不正确的情况下寻求所述潜在响应选项的误分类成本,以及基于评估针对所述潜在响应选项的所述不确定性值和所述误分类成本,从所述潜在响应选项选择响应以传输到所述用户。2.根据权利要求1所述的系统,其中所述输入理解平台还包括:输入识别组件,其用于接收、处理并且转换所述输入以用于识别,并且确定与所述输入的识别相关联的置信度值;输入理解组件,其用于分析所述输入以用于理解,所述理解包括:确定经分析的所述输入的备选理解,以及确定与经分析的所述输入的所述备选理解相关联的置信度值;以及输入上下文组件,其用于评估经分析的所述输入的上下文,评估所述上下文包括:基于对经分析的所述输入的所述上下文的评估来确定可能的响应选项,以及基于对每个潜在响应选项的所述参数的评估来确定针对每个潜在响应选项的置信度值,以及其中所述用户交互中介组件聚合从所述输入识别组件、所述输入理解组件以及所述输入上下文组件接收到的置信度水平值以确定所述不确定性值。3.根据权利要求2所述的系统,其中所述输入是由所述系统接收到的声音输入,所述输入识别组件是语音识别组件,所述输入理解组件是口头语言理解组件,以及所述输入上下文组件是对话策略组件。4.根据权利要求1所述的系统,其中所述用户交互中介组件:基于所选择的上下文,确定在所选择的所述响应是对于所述输入的进一步澄清的请求的情况下澄清接收到的所述输入的模式;生成与所确定的澄清的所述模式中的每一个相关联的成本值;基于对针对所确定的澄清的所述模式的所生成的所述成本值的评估,选择澄清所述输入的模式;以及基于使用由所述系统管理的知识信息分析所述输入,标识与用于所述用户进行响应的澄清的所述模式相关联的参数。5.根据权利要求1所述的系统,其中所述用户交互中介组件针对所述响应通过以下各项中的一项来确定执行动作还是请求进一步澄清:分析针对潜在响应的用于所述误分类成本和所述不确定性值的有区别的分类器;以及基于针对潜在响应的所述误分类成本和所述不确定性值的组合,对概率数据进行建模。6.根据权利要求1所述的系统,其中所述误分类成本是估计在潜在响应选项证明是不正确的情况下并且在与所述潜在响应选项相关联的所述参数证明是不正确的情况下的影响的成本值,并且其中所述误分类成本基于主观测量和经验数据中的至少一个而被确定。7.一种计算机实现的方法,包括:使用输入识别组件、输入理解组件以及输入上下文组件来分析接收到的输入;当存在关于对所述接收到的输入的响应的不确定性时,针对对所述接收到的输入的潜在响应,生成...

【专利技术属性】
技术研发人员:O·Z·克汉R·萨里卡亚
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1