孤立话语检测系统和方法技术方案

技术编号:15193669 阅读:58 留言:0更新日期:2017-04-20 14:40
孤立项检测器。孤立项检测器处理来自目标语言理解对话系统的域外话语,以确定该域外话语是否表达了特定意图,该特定意图使得目标语言理解对话系统在回退处理(诸如执行通用web搜索)不大可能被web搜索满意的情况下采取特定动作。这种话语被称为孤立项,因为其无法被任意任务域或回退处理适当地处理。孤立项检测器通过主要关注于话语的结构而不是内容来将孤立项从web搜索查询和其他域外话语中区分。由孤立项检测器检测到的孤立项可以在线和离线使用以改进目标语言理解对话系统的用户体验。孤立项检测器还可以用于从web搜索引擎查询日志中挖掘结构上相似的查询或句子。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
智能电话和其他设备已经使得目标语言理解对话系统(诸如虚拟个人助理)广泛地可用于消费者。目标语言理解对话系统在有限数目的选定主题领域(即,任务域)中提供用户输入的深度理解。在这些任务域外,目标语言理解对话系统回退到肤浅理解或通用技术来处理用户输入。常见回退是将域外用户输入视为通用web搜索的对象。用户不是总能意识到目标语言理解对话系统的能力和限制。例如,智能电话上的虚拟个人助理可能受限于:电话、短消息服务(SMS)、电子邮件、日历、闹钟、提醒事项、备忘录、天气,并且假设任务域允许虚拟个人助理用任务辅助用户,诸如拨打电话、发送文本消息和电子邮件、设置闹钟和提醒事项、创建备忘录和日历条目、以及获取关于天气或位置的信息。因为智能电话能够进行其他活动(例如,播放音乐),所以用户可以假设虚拟个人助理也可以用这些其他活动进行辅助。例如,用户可能请求虚拟个人助理“播放史密斯飞船乐队(Aerosmith)的歌曲”,从而期望收听到来自用户音乐库的选集。在没有音乐任务域的情况下,用户的请求不被理解。用户得到了网页列表,而不是听到所请求的音乐。用户可以尝试重复和/或改述请求,而没有意识到虚拟个人助理不知道如何处理音乐任务。同时,用户识别到虚拟个人助理的此回退行为,并且通常使用期望获得回退web搜索结果的简单关键字(例如,“最低工资”)。从虚拟个人助理的角度,无论播放音乐的请求还是关键字都不被任意任务域覆盖,因此它们被视为web搜索请求;然而,用户体验大不相同。从用户的角度,响应于播放音乐的请求而得到web搜索结果是令人沮丧的,这是因为没有满足用户期望。另一方面,当得到web搜索结果是用户期望的时,web搜索结果是令人满意的。技术问题是在针对目标语言理解对话系统而不被其任意任务域覆盖、旨在取得结果而不是返回web搜索结果的请求与其中web搜索是适当的web搜索查询之间进行区分。本专利技术正是针对这些和其他考虑事项所做出。虽然讨论了相对具体的问题,但是应当理解的是,这里所公开的方面并不应当限于解决
技术介绍
中所标识的具体问题。
技术实现思路
提供该
技术实现思路
而以简化形式对以下将在具体实施方式中进一步进行描述的概念的选择进行介绍。该
技术实现思路
并非意在标识所请求保护主题的关键特征或必要特征,其也并非意在被用来帮助确定所请求保护主题的范围。孤立话语检测系统和相关方法的各方面包括孤立项(orphan)检测器,该孤立项检测器处理来自目标语言理解对话系统的域外话语,以确定该域外话语是否表达了特定意图,该特定意图使得目标语言理解对话系统在回退处理(诸如执行通用web搜索)不大可能被web搜索满意的情况下采取特定动作。并入孤立项检测器的对话系统接收一个或多个话语用于处理。使用域分类器认为话语处于域中还是域外基于该话语是否被目标理解部件的任意任务域覆盖。特征被从话语中提取用于在分类和理解话语中使用。特征提取可以包括以下中的一个或多个:词汇解析操作、词性标注操作、句法解析操作和语义解析操作。孤立项确定基于所提取的特征来标识域外话语是否为孤立项。所使用的一个词汇特征仅仅是来自话语的词语n元语法。因为孤立项检测器更多地依赖于结构而非内容,因此句法特征也可以供孤立项分类器使用。用于在孤立项确定中使用的基线句法特征是词性标注n元语法。语义特征也有用于孤立项分类器模型。针对谓语和论元(argument)集的存在的检查为高查准率孤立项分类提供了一个语义特征。孤立项不被视为与通用web搜索查询相同。这提供了改进的用户体验。用户体验被改进,不是因为对话系统能够满足用户的请求,而是因为即使在用户请求无法被满足时对话系统也能提供有意义的响应。附图说明本公开另外的特征、方面和优势将通过参考以下附图而得到更好地理解,其中要素并非依比例绘制从而更为清楚地示出细节,并且其中同样的附图标记贯穿多个视图而指示同样的要素:图1是图示利用孤立项检测器的目标语言理解对话系统的各方面的系统示图;图2是图示用于检测和处理孤立项的方法的各方面的高阶流程图;图3图示了基于选区的句法结构解析的示例;图4图示了应用于被图3中句法解析的句子的语义解析的示例;图5是图示在离线使用场景中使用孤立项针对新(即,未覆盖)的任务域对语义模型进行非监督训练的方法的各方面的高阶流程图;图6是图示适合于实施本专利技术各方面的计算设备的物理部件的框图;图7A图示了适合于实施本专利技术各方面的移动计算设备;图7B是图示了适合于实施本专利技术各方面的移动计算设备的架构的框图;和图8是本专利技术的各方面可以利用其进行实施的分布式计算系统的简化框图。具体实施方式以下将参考形成本专利技术一部分并示出各具体示例性方面的附图更完整地描述本专利技术的各个方面。然而,本专利技术可以以许多不同的形式来实现,而并不应当将其解释为限于此处所阐述的方面;相反地,提供这些实施例以使得本公开透彻和完整,并且会将各方面的范围完全传达给本领域普通技术人员。各个方面可以实施为方法、系统或设备。因此,各实现方式可以使用硬件、软件或者软件和硬件和软件的组合来实施。因此,以下详细描述并非在限制意义上进行。孤立项检测器和相关方法的各方面在这里进行描述并且在附图中有所图示。孤立项检测器处理来自目标语言理解对话系统的域外话语,以确定该域外话语是否表达了特定意图,该特定意图使得目标语言理解对话系统在回退处理(诸如执行通用web搜索)不大可能被web搜索满意的情况下采取特定动作。这种话语被称为孤立项,因为其无法被任意任务域或回退处理适当地处理。孤立项检测器通过主要关注于话语的结构而不是内容来将孤立项从web搜索查询和其他域外话语中区分。由孤立项检测器检测到的孤立项可以在线和离线使用以改进目标语言理解对话系统的用户体验。孤立项检测器还可以用于从web搜索引擎查询日志中挖掘结构上相似的查询或句子。图1是图示利用孤立项检测器的目标语言理解对话系统的各方面的系统示图。对话系统100包括孤立项检测器102和目标理解部件104。该对话系统可以以使用单个计算设备的本地架构或者如图所示使用一个或多个计算设备的分布式架构(诸如但不限于与服务器108通信的客户端设备106)实现。客户端设备106和服务器108可以使用各种计算设备实现,包括但不限于:服务器或台式计算机、膝上型计算机、平板计算机、智能电话、智能手表和智能家电。分布式部件可以经由网络进行通信,诸如但不限于:局域网、广域网或因特网。对话系统100提供了用户接口110,该用户接口110用于通过各种输入和输出形态与用户112交互。输入和输出形态的类型和数目取决于客户端设备106的硬件。适当输入和输出形态的示例包括但不限于语音、文本、手写、触摸和手势。客户端设备106经由一个或多个输入设备116从用户112接受谈话输入114,并且经由一个或多个输出设备120呈现谈话输出118供用户112消费。适当输入设备的示例包括但不限于:麦克风、触摸屏、相机或扫描仪、物理键盘或小键盘、虚拟键盘或小键盘。适当输出设备的示例包括但不限于:扬声器、显示屏和投影仪。为了通过示例提供上下文,对话系统100的各方面可以被描述为响应于用户话语的多模虚拟个人助理(VPA)。然而,孤立项检测器102可以结合各种目标语言理解对话系统一起使用,并不应当受限于与虚拟个人助理一起使用。为了方便本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201580045271.html" title="孤立话语检测系统和方法原文来自X技术">孤立话语检测系统和方法</a>

【技术保护点】
一种用于将域外话语分类为web搜索查询或者目标语言理解对话系统的孤立项的方法,所述方法包括:接收被所述目标语言系统的域分类器拒绝的域外话语;针对一个或多个语义、句法、词性标注或词汇特征,对所述域外话语进行评估,所述一个或多个语义、句法、词性标注或词汇特征用于确定所述域外话语是web搜索查询还是所述目标语言理解对话系统的孤立项;确定所述域外话语是孤立项;生成响应,所述响应指示所述域外话语被理解为针对所述目标语言理解对话系统的、用于执行机器动作的请求。

【技术特征摘要】
【国外来华专利技术】2014.08.22 US 14/466,6421.一种用于将域外话语分类为web搜索查询或者目标语言理解对话系统的孤立项的方法,所述方法包括:接收被所述目标语言系统的域分类器拒绝的域外话语;针对一个或多个语义、句法、词性标注或词汇特征,对所述域外话语进行评估,所述一个或多个语义、句法、词性标注或词汇特征用于确定所述域外话语是web搜索查询还是所述目标语言理解对话系统的孤立项;确定所述域外话语是孤立项;生成响应,所述响应指示所述域外话语被理解为针对所述目标语言理解对话系统的、用于执行机器动作的请求。2.根据权利要求1所述的方法,进一步包括以下动作:接收作为所述目标语言理解对话系统的输入而被提供的话语;以及确定所述话语是未被与所述目标语言理解对话系统相关联的任务域覆盖的域外话语。3.根据权利要求1所述的方法,进一步包括以下动作:生成消息,所述消息报告所述域外话语被理解为针对所述目标语言理解对话系统的、用于执行机器动作的请求;以及向与所述目标语言理解对话系统相关联的输出设备呈现所述消息。4.根据权利要求1所述的方法,其中确定所述域外话语是孤立项的动作进一步包括基于作为孤立项分类器的输入而被提供的所述域外话语的特征,使用所述孤立项分类器将所述域外话语分类为孤立项的动作。5.根据权利要求1所述的方法,进一步包括在确定所述域外话语是孤立项之前,从所述话语提取特征的动作。6.根据权利要求1所述的方法,进一步包括以下动作:针对谓语和论元检查所述话语;以及使用谓语和论元的存在作为孤立项分类特征。7.根据权利要求1所述的方法,进一步包括以下动作:语义上聚类多个孤立项;以及标识包含孤立项的选定测量的语义簇,所述选定测量指示用户频繁进行与不受支持的任务域有关的请求。8.一种具有至少一个域的目标语言理解对话系统,所述目标语言理解对话系统包括:特征提取器,所述特征提取器可操作用于从话语提取特征;分类器,所述分类器可操作用于接收所述特征作为输入,确定所述话语是否为不属于与所述分类器相关联的任意域的域外话语;孤立项检测器,所述孤立项检测器可操作用于接收所述域外话语,确定所述域外话语是否为孤立项;以及交互管理器,所述交互管理器可操作用于处理所述孤立项而不向通用web搜索发送所述孤立项。...

【专利技术属性】
技术研发人员:G·图尔A·德欧拉斯D·哈卡尼图尔
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1