机器学习命令交互制造技术

技术编号:22758101 阅读:38 留言:0更新日期:2019-12-07 05:15
本文公开的示例涉及经由聊天交互接收查询,根据训练后的机器学习模型将所接收的查询转换成预定义命令集中的一个预定义命令,以及向聊天交互提供该预定义命令集中的一个预定义命令的结果。

Machine learning command interaction

The examples disclosed herein relate to receiving a query via chat interaction, converting the received query into a predefined command in a predefined command set according to the trained machine learning model, and providing chat interaction with the result of a predefined command in the predefined command set.

【技术实现步骤摘要】
【国外来华专利技术】机器学习命令交互
技术介绍
除了其它特征之外,多功能设备常常用于打印、复制、传真和/或扫描文档。这样的设备提供一批可用菜单命令、选项以及向用户提供信息的能力。附图说明在附图中,相似的附图标记指相似的部件或框。下面的详细描述参考附图,其中:图1是用于提供查询交互的示例系统;图2是用于提供查询交互的方法的示例的流程图;以及图3是用于提供查询交互的示例计算设备的框图。具体实施方式为了简便和说明性的目的,通过主要参考实施例的示例来描述实施例的原理。在下面的描述中,很多特定的细节被阐述,以便提供实施例的理解。然而,对本领域普通技术人员将明显的是,可以在没有这些特定细节的限制的情况下实践实施例。在一些实例中,没有详细地描述众所周知的方法和/或结构,以便不使实施例不必要地模糊。诸如打印机、膝上型计算机、智能电话和/或其它计算设备的各种电子设备常常提供用于与用户交互的用户界面(UI)。这样的UI可例如提供状态信息、接受命令和指令、提供维护指令等。在一些情况下,可能存在设备能够响应的数百个命令,但用户常常对键入和/或通过很多菜单级别点击以尝试和找到正确的UI选项从而访问它们期望的信息几乎没有耐心。在本文的示例中,可提供诸如交互式聊天界面的自然语言界面。有时被称为“聊天机器人”,该界面可从用户接受查询(诸如,键入的和/或说出的)、将查询转换成由设备已知的预定义命令中的一个预定义命令以及向用户提供响应。例如,用户可以询问聊天机器人“油墨剩下多少?”。聊天机器人可使用训练后的机器学习模型来将查询“油墨剩下多少?”转换成特征向量,该特征向量可接着用于识别也被提取到特征向量中的最接近的匹配模型。命令可在设备上被执行,并且答案被提供给用户作为来自聊天机器人的响应。可包括图像和/或文本特征向量的特征向量可表示文本表示的特性。例如,文本特征向量可表示词的相似性、语言规律、基于训练后的词的上下文信息、形状、区的描述、对其它向量的接近度等。特征向量可以在多模空间中是可表示的。多模空间可包括k维坐标系。当在多模空间中填充图像和文本特征向量时,可通过比较在多模空间中的特征向量的距离来识别对查询的匹配图像,从而识别相似的图像特征和文本特征。距离比较的一个示例可包括余弦接近度,其中在多模空间中的特征向量之间的余弦角被比较以确定最接近的特征向量。余弦相似特征可在多模空间中是邻近的,而不相似的特征向量可以是远端的。特征向量可具有k维或在多模空间中的坐标。具有相似特征的特征向量在向量模型中的多模空间中接近彼此被嵌入。基于特征的向量表示可使用各种模型以在连续向量空间中表示文档的词、图像和结构。不同的技术可应用于表示在向量空间中的不同特征,且不同级别的特征可根据可能需要被维护的文档的数量来存储。例如,在语义上相似的词可通过答复在相同的上下文中出现的词共享语义含义的事实来映射到附近的点。运用这个原理的两个示例方法包括基于计数的模型(例如潜在语义分析)和预测模型(例如神经概率语言模型)。基于计数的模型计算某个词多长时间与它的邻近词共同出现在大文本语料库中一次的统计,并接着将这些计数统计一直映射到每个词的小密集向量。预测方法直接试图在所获悉的小密集嵌入向量(模型的被考虑的参数)方面从它的邻居预测词。其它层可捕获其它特征,诸如字体类型分布、布局、图像内容和定位、颜色图等。在一些示例中,可以用特征向量和由打印设备理解的预定义命令集的标识符创建索引。在一些实现中,可以为多个不同的设备提取相似的命令集,且包括可包括每个设备的标识符的提取。编索引可包括存储命令的标识符(ID)和它的特征向量,且搜索可返回图像的标识符。每个命令可例如包括所需的和/或可选的参数。例如,识别油墨水平的命令可包括可选的参数以识别特定颜色的墨盒的油墨水平和/或所有安装的墨盒的油墨水平。诸如通过扫描在设备的应用编程界面(API)中可得到的适当功能列表,可手动地选择和/或自动填充命令的列表。在一些实现中,可对诸如技术论文、新闻文章、虚构和/或非虚构作品等的大集合的自然语言文档训练机器学习模型。模型因此可插入语义含义和不同词的相似性。例如,模型可通过找到具有那些标题的两个相似的新闻故事来获悉词“奥巴马对伊利诺伊州的媒体讲话”在语义上类似于词“总统问候芝加哥的新闻界”。机器学习模型可包括例如用负采样训练的word2vec模型。word2vec是用于从原始文本学习词嵌入(wordembeddings)的在计算上有效的预测模型。它可依赖于各种模型,诸如连续词袋模型(CBOW)和Skip-Gram模型。CBOW例如从源上下文词(“thecatsitsonthe”)预测目标词(例如“mat”),而skip-gram正好反过来进行并且从目标词预测源上下文词。机器学习模型也可由词的其它类型的向量表示(诸如全局向量(GloVe))或任何其它形式的词嵌入组成。通过从该预定义命令集提取特征向量,每个命令可通过将相对小的一组关键词映射到该预定义命令集中的每一个来对各种自然语言查询变得可用。此外,通过向量表示命令的索引的搜索比常规文本串匹配搜索花费明显更少的时间。一旦被提取到特征向量中,用户的自然语言查询就可用于计算在查询和命令之间的词移动距离(WMD)。WMD对在两个文本表示之间的相异性进行测量作为一个表示的嵌入后的词需要行进以到达另一表示的嵌入后的词的距离的最小数量。WMD越低,每个表示的词就越近和/或越相同。图1是用于提供查询交互的示例系统100的框图。系统100可包括包含存储器115的计算设备110。计算设备110可包括例如通用和/或专用计算机、服务器、大型机、桌上型计算机、膝上型计算机、平板计算机、智能电话、游戏控制台、打印机和/或能够提供计算能力的任何其它系统,计算能力与提供本文所述的实现一致。计算设备110可在存储器115中存储语言模型引擎120和交互引擎125。系统100的引擎120、125中的每一个可包括硬件和程序的任何组合,以实现相应引擎的功能。在本文所述的示例,硬件和程序的这样的组合可以以多种不同的方式实现。例如,引擎的程序可以是存储在非瞬态机器可读存储介质上的处理器可执行的指令,并且引擎的硬件可包括用于执行那些指令的处理资源。在这样的示例中,机器可读存储介质可存储指令,指令在由处理资源执行时实现引擎120、125。在这样的示例中,系统100可包括存储指令的机器可读存储介质和用于执行指令的处理资源,或机器可读存储介质可以是分开的,但是可以是系统100和处理资源可访问的。语言模型引擎120可根据训练后的模型将接收的查询转换成预定义命令集130中的一个预定义命令。例如,训练后的模型可包括机器学习模型,例如对多个自然语言文档的负采样进行训练的word2vec模型。在一些实现中,将所接收的查询转换成预定义命令集130中的一个预定义命令可包括将所接收的查询的每个词转换成多维向量表示。在一些实现中,将所接收的查询转换成预定义命令集130中的一个预定义命令可包括:计算在所接收的查询的每个词和与预定义命令集130相关联的词表中的每个词之间的词移动本文档来自技高网...

【技术保护点】
1.一种系统,包括:/n存储器,所述存储器存储:/n语言模型引擎,所述语言模型引擎用于:/n根据训练后的模型将接收的查询转换成预定义命令集中的一个预定义命令;以及/n交互引擎,所述交互引擎用于:/n从用户接收查询,/n从所述语言模型引擎接收所述预定义命令,以及/n根据从所述语言模型引擎接收的所述预定义命令向所述用户提供对所述查询的响应。/n

【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:
存储器,所述存储器存储:
语言模型引擎,所述语言模型引擎用于:
根据训练后的模型将接收的查询转换成预定义命令集中的一个预定义命令;以及
交互引擎,所述交互引擎用于:
从用户接收查询,
从所述语言模型引擎接收所述预定义命令,以及
根据从所述语言模型引擎接收的所述预定义命令向所述用户提供对所述查询的响应。


2.根据权利要求1所述的系统,其中所述训练后的模型包括对多个自然语言文档进行训练的机器学习模型。


3.根据权利要求2所述的系统,其中,所述机器学习模型包括词嵌入模型。


4.根据权利要求1所述的系统,其中,所述交互引擎经由聊天界面从所述用户接收所述查询。


5.根据权利要求1所述的系统,其中,将所接收的查询转换成所述预定义命令集中的一个预定义命令包括将所接收的查询的每个词转换成多维向量表示。


6.根据权利要求5所述的系统,其中,将所接收的查询转换成所述预定义命令集中的一个预定义命令进一步包括:计算在所接收的查询的每个词和与所述预定义命令集相关联的词表中的每个词之间的词移动距离。


7.根据权利要求1所述的系统,其中,将所接收的查询转换成所述预定义命令集中的一个预定义命令进一步包括:识别所述预定义命令集中包括相对于所接收的查询的最小词距离的所述一个预定义命令。


8.根据权利要求1所述的系统,其中所述预定义命令集包括与打印设备相关...

【专利技术属性】
技术研发人员:克利斯汀·佩罗内托马斯·保拉罗伯托·佩雷拉·西尔韦拉
申请(专利权)人:惠普发展公司有限责任合伙企业
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1