用于解析在不同域中有潜在模糊含义的表达的方法和装置制造方法及图纸

技术编号:22330139 阅读:24 留言:0更新日期:2019-10-19 12:17
本公开涉及用于解析在不同域中有潜在模糊含义的表达的方法和装置。本发明专利技术扩展到用于解析在不同域中具有潜在模糊含义的表达的方法、系统、和计算机程序产品。多域自然语言理解系统可以支持各种不同类型的客户端。可以横跨多个域解析表达。可以向域指派权重。权重可以是客户端专用或表达专用的,使得所选择的解析对于该类型的客户端或其上下文更可能是正确的。可以根据作为元数据与表达一起携带的识别信息或者直接作为元数据携带的权重集选择所存储的权重集。另外或者替代地,可以在排序列表或比较域对中对域排序,以使得一些域相比其他域更适用于某个客户端类型或客户端上下文。

Methods and devices for parsing expressions with potentially ambiguous meanings in different domains

【技术实现步骤摘要】
用于解析在不同域中有潜在模糊含义的表达的方法和装置
本专利技术一般地涉及虚拟助理,并且更具体地涉及被配置为理解自然语言的虚拟助理。
技术介绍
现代虚拟助理可以回答问题并执行使用自然语言表达的命令。更高级的虚拟助理可以处理很多域中的问题和命令。域是诸如提供有关特定领域的信息或执行有关特定设备的动作的相关能力的不同集合。例如,一些虚拟助理可以给出天气预报、利用来自维基百科的事实回答问题、播放所请求的音乐、播放所请求的视频、发送短消息服务(SMS)消息、进行电话呼叫等。可以开发不同的虚拟助理来处理不同的域组合中的问题和命令。在一些环境中,虚拟助理在支持多种不同类型的客户端(例如,智能扬声器、移动电话、汽车、自动售货机等)的服务器上运行。每种不同类型的客户端可以提供被配置为横跨域集合处理问题和命令的虚拟助理。域的数目可以在少至用于非常专门的虚拟助理的单个域到用于广泛使用的虚拟助理的多个域之间变化。域对于虚拟助理可以是唯一的或者可以在多个虚拟助理中间共享。例如,很多虚拟助理可以使用共用天气域。另一方面,用于零售商的虚拟助理可以具有唯一域来回答有关现有物品的查询。有时,虚拟助理会接收到潜在模糊的自然语言表达。即,该表达潜在地在一个以上域中有意义。例如,发出口头表达“playfootloose(播放自由自在)”的用户可以指音乐域中的流行歌曲和视频域中的流行电影。表达“播放情深深雨蒙蒙”可以指音乐域中的流行歌曲和视频域中的流行电影。再如,表达“howhighismounteverest(珠穆朗玛峰有多高)”可以指地理域中的高度或天气域中的温度。在接收到表达时,虚拟助理可以计算针对多个不同域中的每个域的分数,该分数大致指示该表达在该域中有意义的程度。虚拟助理选择具有最佳分数的域并且使用来自该域的解析来产生对于用户的响应。对于潜在模糊的表达,多个域可以提供高分数。但是,最佳(最高)得分域可能不是用户想要处理潜在模糊表达的域。结果,虚拟助理给出了不适当的响应,这使用户受挫。其他相关技术是:美国专利申请公开20140163959A1,专利技术人赫伯特等,第0006、0008、0024、和0028段。美国专利申请公开20140244712A1,专利技术人沃尔特斯等,第0083段。XIAOHULIU等,PersonalizedNaturalLanguageUnderstanding(个性化自然语言理解),Interspeech,2016年9月,微软公司。PUYANGXU等,CONTEXTUALDOMAINCLASSIFICATIONINSPOKENLANGUAGEUNDERSTANDINGSYSTEMUSINGRECURRENTNEURALNETWORK(使用递归神经网络的口语理解系统中的上下文域分类),2014年ICASSP会议,微软公司。YIYANG,ROBUSTADAPTATIONOFNATURALLANGUAGEPROCESSINGFORLANGUAGEVARIATION(语言变异的自然语言处理的鲁棒适应),博士论文,2017年5月,乔治亚理工学院。GIOVANNICAMPAGNA,DeepAlmond:ADeepLeaning-basedVirtualAssistant(DeepAlmond:基于深度学习的虚拟助理),2017,斯坦福。EUGENEGROIS,LearningStrategiesforOpen-DomainNaturalLanguageQuestionAnswering(开放域自然语言问答的学习策略),ACLstudent'05ProceedingsoftheACLstudentResearchWorkshop(ACL学生研究工作会的ACL学生'05论文集),第85-90页。附图说明参考下面的描述和附图,本专利技术的具体特征、方面、和优点将变得更好理解,其中:图1示出了用于解析表达的示例计算机环境。图2示出了在多域自然语言理解(NLU)解析服务器解析表达的示例。图3示出了在多域自然语言理解(NLU)解析服务器解析表达的另一示例。图4A示出了示例表达包。图4B示出了另一示例表达包。图5A示出了附加表达包。图5B示出了又一表达包。图6示出了在多域自然语言理解(NLU)解析服务器解析音频样本的示例。图7示出了在多域自然语言理解(NLU)解析服务器生成对于表达的响应的示例。图8示出了示例图形用户界面(GUI)配置器屏幕。图9示出了在多域自然语言理解(NLU)解析服务器使用域排名选择域的示例。图10A示出了示例转盘。图10B示出了示例随机存取存储器(RAM)芯片。图11A示出了封装片上系统(SoC)的示例焊料球侧。图11B示出了片上系统(SoC)的示例架构。图12A示出了基于机架的服务器的示例。图12B示出了服务器的示例架构。具体实施方式本专利技术扩展到用于解析在不同域中具有潜在模糊含义的表达的方法、系统、机器、制品、和计算机程序产品。本专利技术的多个方面可以对不同域提供的表达的不同解析赋予权重和/或赋予优先级。赋予权重和/或赋予优先级可以用来选择用户的表达的更适当的解析。因此,赋予权重和/或赋予优先级可以允许开发者开发出用于特定用途和用于特定条件的虚拟助理,以使得虚拟助理更有可能基于用户意图挑选出适当的(正确的)解析。赋予权重和/或赋予优先级还可以提供以下优点,即允许开发者降低用户得到来自竞争者的域的结果的可能性或者潜在地避免这种情况。在一些方面,解析器被配置为横跨多个不同域处理表达。解析器从用户接收表达。表达可以是由用户输入的文本(例如,美国信息互换标准代码(ASCII)字符或统一码字符)、词素的标记化序列、语音音频样本等。可以使用语音识别从语音音频样本提取词素的序列。解析器在每个域中对表达进行解析,以计算表达在每个域中的第一似然分数。解析器使用与表达相关联的元数据选择每个域的相应权重。在一些方面,元数据包括以下各项中的一项或多项:客户端ID、供应商ID、产品ID、版本、用户ID、位置、传感器信息等。在这些方面,解析器基于元数据的内容选择权重。在其他方面,权重被包括在元数据中。在这些其他方面,元数据可以指定与每个权重相关联的域名或域ID。权重可以表示为整数、浮点数、或其他符号表征。对于每个域,解析器向第一似然分数应用相应权重,以计算第二似然分数。第二似然分数对于从多个域中选择域来提供表达的解析是有用的。例如,可以选择具有超过阈值的第二分数的域作为解析表达的域。可以使用所选择的域来确定用户意图并计算适当的响应。响应可以是视觉或听觉的(例如,声音或口头信息)并且可以使设备执行诸如发送文本或可听消息等的操作。开发者可以开发包括多个可用域中的不同域的解析器(例如,使用具有图形用户界面的平台),并且可以向每个所包括的域指派权重。替代地或者结合使用权重,本专利技术的多个方面还可以利用域排名。如果多个域具有超过阈值的分数,则可以选择排名较高的域作为解析表达的域。阈值在多个域中间可以相同或不同。可以基于上下文(例如,什么应用正在运行、前一个对话主题等)将排名指定为排序列表、具有偏好的域对。在一方面,为没有明确排名的“其他”域指定排名。多个方面包括支持多个客户端类型的基于云的多域自然语言理解(NLU)解析平台。客户端开发者可以开发使用其本文档来自技高网...

【技术保护点】
1.一种方法,包括:接收包含自然语言表达和元数据的表达包;根据第一域解析所述自然语言表达,以产生针对所述第一域的第一分数和第一解析;根据第二域解析所述自然语言表达,以产生针对所述第二域的第一分数和第二解析;使用所述元数据识别针对所述第一域的第一权重并识别针对所述第二域的第二权重;向针对所述第一域的第一分数应用所述第一权重,以计算针对所述第一域的第二分数;向针对所述第二域的第一分数应用所述第二权重,以计算针对所述第二域的第二分数;考虑针对所述第一域的第二分数和针对所述第二域的第二分数,选择所述第一解析作为所述自然语言表达的适当解析;以及基于对所述第一解析的选择,计算对于所述自然语言表达的响应。

【技术特征摘要】
2018.04.02 US 15/942,8751.一种方法,包括:接收包含自然语言表达和元数据的表达包;根据第一域解析所述自然语言表达,以产生针对所述第一域的第一分数和第一解析;根据第二域解析所述自然语言表达,以产生针对所述第二域的第一分数和第二解析;使用所述元数据识别针对所述第一域的第一权重并识别针对所述第二域的第二权重;向针对所述第一域的第一分数应用所述第一权重,以计算针对所述第一域的第二分数;向针对所述第二域的第一分数应用所述第二权重,以计算针对所述第二域的第二分数;考虑针对所述第一域的第二分数和针对所述第二域的第二分数,选择所述第一解析作为所述自然语言表达的适当解析;以及基于对所述第一解析的选择,计算对于所述自然语言表达的响应。2.如权利要求1所述的方法,其中,使用所述元数据识别针对所述第一域的第一权重并识别针对所述第二域的第二权重包括基于客户端ID识别权重。3.如权利要求1所述的方法,其中,使用所述元数据识别针对所述第一域的第一权重并识别针对所述第二域的第二权重包括基于供应商ID和产品ID识别权重。4.如权利要求1所述的方法,其中,选择所述第一解析作为所述适当解析包括:基于针对所述第一域的第二分数高于针对所述第二域的第二分数,选择所述第一解析。5.如权利要求1所述的方法,其中,选择所述第一解析作为所述适当解析包括:基于针对所述第一域的第二分数超过阈值,选择所述第一解析。6.如权利要求1所述的方法,其中,接收包含自然语言表达和元数据的表达包包括从客户端设备接收所述自然语言表达和所述元数据,所述元数据指示哪个应用正在所述客户端设备的前台运行。7.如权利要求6所述的方法,还包括:针对所述客户端设备采用计算机化动作,以实现所计算的响应。8.如权利要求1所述的方法,还包括:提供用于各种类型的客户端的针对自然语言理解的可配置平台;以及从开发者接收在所述可配置平台向所述第一域应用所述第一权重并向所述第二域应用所述第二权重的指令。9.一种方法,包括:接收包含自然语言表达、对应于第一域的第一权重、和对应于第二域的第二权重的表达包;根据所述第一域解析所述自然语言表达,以产生针对所述第一域的第一分数和第一解析;根据所述第二域解析所述自然语言表达,以产生针对所述第二域的第一分数和第二解析;向针对所述第一域的第一分数应用所述第一权重,以计算针对所述第一域的第二分数;向针对所述第二域的第一分数应用所述第...

【专利技术属性】
技术研发人员:魏思拓莫轲文莫伯耐
申请(专利权)人:声音猎手公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1