人工智能数字代理制造技术

技术编号:18940653 阅读:25 留言:0更新日期:2018-09-15 11:05
实现涉及:从设备接收通信数据,通信数据包括由设备的用户输入的数据;基于通信数据接收文本数据;基于通过人工智能服务处理文本数据来提供意图集合和实体集合,意图集合包括在文本数据中指示的一个或多个意图,实体集合包括在文本数据中指示的一个或多个实体,人工智能服务实现卷积神经网络(CNN);基于文本数据、意图集合和实体集合中的一项或多项来标识动作集合;接收结果集合,该结果集合包括来自执行动作集合中的动作的至少一个结果;提供结果数据;以及向设备传输结果数据。

AI digital agent

Implementation involves: receiving communication data from a device, including data input by the user of the device; receiving text data based on communication data; providing a set of intents and entities based on processing text data through an artificial intelligence service; and including one or more intents indicated in the text data. Volume sets include one or more entities indicated in text data, and Artificial Intelligence Service implements convolutional neural networks (CNN); identifies action sets based on one or more of text data, intention sets, and entity sets; and receives a result set that includes at least one action from the execution action set. Results; provide result data; and transmit data to the device.

【技术实现步骤摘要】
人工智能数字代理
技术介绍
用户(例如,企业的客户)可以向呼叫中心呼叫以试图解决问题、收集信息和/或使用服务。呼叫中心已经引入了自动化服务,自动化服务使得用户能够深度挖掘菜单,例如,以试图集中资源来致力于特定用户(例如,标识可能最适合于解决用户需求的特定部门和/或客户服务代表)。示例自动化服务可以包括人工智能,其处理用户说出的单词以将呼叫路由到特定资源。然而,这样的自动化服务可能有缺点。例如,尽管自动化服务可能能够路由呼叫,但是自动化服务在其他功能(例如,执行所请求的服务)方面受到限制。
技术实现思路
本公开的实现总体上涉及用于基于人工智能(AI)的数字代理的计算机实现的平台。更具体地,本公开的实现涉及能够可听地与用户交互并且能够基于用户交互来执行一个或多个动作的基于AI的数字代理。在一些实现中,动作包括:从设备接收通信数据,通信数据包括由设备的用户输入的数据;基于通信数据接收文本数据;基于通过人工智能服务处理文本数据来提供意图集合和实体集合,意图集合包括在文本数据中指示的一个或多个意图,实体集合包括在文本数据中指示的一个或多个实体,人工智能服务实现一个或多个卷积神经网络(CNN);基于文本数据、意图集合和实体集合中的一项或多项来标识动作集合,动作集合包括要由一个或多个计算机实现的服务执行的一个或多个动作;接收结果集合,该结果集合包括来自执行动作集合中的动作的计算机实现的服务的至少一个结果;提供包括描述至少一个结果的数据的结果数据;以及向设备传输结果数据。这个方面的其他实现包括对应的系统、装置、以及体现在计算机存储设备上被配置为执行方法的动作的计算机程序。这些和其他实现每个可以可选地包括以下特征中的一个或多个特征:人工智能服务包括使用自然语言处理(NLP)来提供意图集合的意图分类模型;NLP包括单词嵌入;人工智能服务包括使用命名实体识别(NER)来提供实体集合的实体提取模型;动作还包括确定意图集合和实体集合中的一者或两者为空,并且作为响应,向设备传输至少一个消歧问题;动作还包括基于意图集合中的意图确定预期实体不在实体集合中,并且作为响应,向设备传输至少一个消歧问题;动作还包括确定结果集合包括缺陷,并且作为响应,向设备传输至少一个消歧问题;通信数据包括音频数据,并且结果数据包括音频结果数据;通信数据包括文本数据,并且结果数据包括文本结果数据;并且结果数据包括由语音响应合成模块基于文本结果数据提供的音频数据。本公开还提供了一种计算机可读存储介质,其耦合到一个或多个处理器并且具有在其上存储的指令,该指令在由一个或多个处理器执行时使得一个或多个处理器根据本文中提供的方法的实现来执行操作。本公开还提供了一种用于实现本文中提供的方法的系统。该系统包括一个或多个处理器以及耦合到一个或多个处理器的计算机可读存储介质,计算机可读存储介质具有在其上存储的指令,该指令在由一个或多个处理器执行时使得一个或多个处理器根据本文中提供的方法的实现来执行操作。应当理解,根据本公开的方法可以包括本文中描述的方面和特征的任何组合。也就是说,根据本公开的方法不限于本文中具体描述的方面和特征的组合,而是还包括所提供的方面和特征的任何组合。下面在附图和说明书中阐述了本公开的一个或多个实现的细节。本公开的其他特征和优点将从说明书和附图以及权利要求书中显而易见。附图说明图1描绘了根据本公开的实现的示例高级架构;图2描绘了根据本公开的实现的示例架构;以及图3描绘了根据本公开的实现能够被执行的示例过程。具体实施方式本公开的实现总体上涉及用于基于人工智能(AI)的数字代理的计算机实现的平台。更具体地,本公开的实现涉及能够可听地与用户交互并且能够基于用户交互来执行一个或多个动作的基于AI的数字代理。如本文中进一步详细描述的,本公开的实现包括以下动作:从设备接收通信数据,通信数据包括由设备的用户输入的数据;基于通信数据接收文本数据;基于通过人工智能服务处理文本数据来提供意图集合和实体集合,意图集合包括在文本数据中指示的一个或多个意图,实体集合包括在文本数据中指示的一个或多个实体,人工智能服务实现一个或多个卷积神经网络(CNN);基于文本数据、意图集合和实体集合中的一项或多项来标识动作集合,动作集合包括要由一个或多个计算机实现的服务执行的一个或多个动作;接收结果集合,该结果集合包括来自执行动作集合中的动作的计算机实现的服务的至少一个结果;提供包括描述至少一个结果的数据的结果数据;以及向设备传输结果数据。图1描绘了根据本公开的实现的示例高级架构100。示例架构100包括设备102、后端系统108和网络110。在一些示例中,网络110包括局域网(LAN)、广域网(WAN)、因特网、蜂窝电话网络、公共交换电话网络(PSTN)、专用分支交换机(PBX)或其任何适当的组合,并且连接网站、设备(例如,设备102)和后端系统(例如,后端系统108)。在一些示例中,可以通过有线和/或无线通信链路来访问网络110。例如,诸如智能电话等移动设备可以利用蜂窝网络来访问网络110。在所描绘的示例中,后端系统108包括至少一个服务器系统112和数据存储库114(例如,数据库)。在一些示例中,至少一个服务器系统112托管用户可以使用设备与之交互的一个或多个计算机实现的服务。例如,服务器系统112可以托管根据本公开的实现的基于AI的数字代理。在一些示例中,设备102每个可以包括任何适当类型的计算设备,诸如台式计算机、膝上型计算机、手持式计算机、平板电脑、个人数字助理(PDA)、蜂窝电话、网络设备、相机、智能手机、电话、移动电话、增强通用分组无线电服务(EGPRS)移动电话、媒体播放器、导航设备、电子邮件设备、游戏机、或者这些设备或其他数据处理设备中的任何两个或更多个的适当组合。在所描绘的示例中,设备102由用户120使用。根据本公开,用户120使用设备102来可听地与本公开的基于AI的数字助理交互。在一些示例中,用户120可以包括提供基于AI的数字代理的企业的客户,或者代表提供基于AI的数字助理的客户。例如,用户120可以包括使用设备102呼叫企业的呼叫中心并且连接到基于AI的数字助理(例如,托管在后端系统108上)的客户。根据本公开的实现,并且如本文中进一步详细描述的,用户120可以向基于AI的数字助理提供口头输入(例如,语音),基于AI的数字助理能够处理口头输入以请求附加信息(例如,消歧)、执行一个或多个动作、和/或提供一个或多个可听响应。图2描绘了根据本公开的实现的示例架构200。在一些示例中,示例架构200的部件可以托管在一个或多个后端系统(例如,图1的后端系统108)上。在所描绘的示例中,示例架构200包括交互管理器202、动作处理器204、语音到文本服务206、人工智能(机器智能)服务208和训练数据服务210。在一些示例中,示例架构200的每个部件被提供作为由一个或多个计算设备执行的一个或多个计算机可执行程序。在一些示例中,交互管理器202和动作处理器204由企业或者代表企业来操作(例如,托管在由企业或者代表企业来操作的图1的后端系统108上)。在一些示例中,语音到文本服务206、人工智能服务208和/或训练数据服务210由企业或者代表企业来操作(例如,托管在由企业或者本文档来自技高网...

【技术保护点】
1.一种用于提供基于人工智能(AI)的数字助理的计算机实现的方法,所述方法由一个或多个处理器执行并且包括:由所述一个或多个处理器从设备接收通信数据,所述通信数据包括由所述设备的用户输入的数据;由所述一个或多个处理器基于所述通信数据接收文本数据;由所述一个或多个处理器基于通过人工智能服务处理所述文本数据来提供意图集合和实体集合,所述意图集合包括在所述文本数据中指示的一个或多个意图,所述实体集合包括在所述文本数据中指示的一个或多个实体,所述人工智能服务实现一个或多个卷积神经网络(CNN);由所述一个或多个处理器基于所述文本数据、所述意图集合和所述实体集合中的一项或多项来标识动作集合,所述动作集合包括要由一个或多个计算机实现的服务执行的一个或多个动作;由所述一个或多个处理器接收结果集合,所述结果集合包括来自执行所述动作集合中的动作的计算机实现的服务的至少一个结果;由所述一个或多个处理器提供包括描述所述至少一个结果的数据的结果数据;以及由所述一个或多个处理器向所述设备传输所述结果数据。

【技术特征摘要】
2017.03.02 US 15/448,4011.一种用于提供基于人工智能(AI)的数字助理的计算机实现的方法,所述方法由一个或多个处理器执行并且包括:由所述一个或多个处理器从设备接收通信数据,所述通信数据包括由所述设备的用户输入的数据;由所述一个或多个处理器基于所述通信数据接收文本数据;由所述一个或多个处理器基于通过人工智能服务处理所述文本数据来提供意图集合和实体集合,所述意图集合包括在所述文本数据中指示的一个或多个意图,所述实体集合包括在所述文本数据中指示的一个或多个实体,所述人工智能服务实现一个或多个卷积神经网络(CNN);由所述一个或多个处理器基于所述文本数据、所述意图集合和所述实体集合中的一项或多项来标识动作集合,所述动作集合包括要由一个或多个计算机实现的服务执行的一个或多个动作;由所述一个或多个处理器接收结果集合,所述结果集合包括来自执行所述动作集合中的动作的计算机实现的服务的至少一个结果;由所述一个或多个处理器提供包括描述所述至少一个结果的数据的结果数据;以及由所述一个或多个处理器向所述设备传输所述结果数据。2.根据权利要求1所述的方法,其中所述人工智能服务包括使用自然语言处理(NLP)来提供所述意图集合的意图分类模型。3.根据权利要求2所述的方法,其中所述NLP包括单词嵌入。4.根据权利要求1所述的方法,其中所述人工智能服务包括使用命名实体识别(NER)来提供所述实体集合的实体提取模型。5.根据权利要求1所述的方法,还包括:确定所述意图集合和所述实体集合中的一者或两者为空,并且作为响应,向所述设备传输至少一个消歧问题。6.根据权利要求1所述的方法,还包括:基于所述意图集合中的意图确定预期实体不在所述实体集合中,并且作为响应,向所述设备传输至少一个消歧问题。7.根据权利要求1所述的方法,还包括:确定所述结果集合包括缺陷,并且作为响应,向所述设备传输至少一个消歧问题。8.根据权利要求1所述的方法,其中所述通信数据包括音频数据,并且所述结果数据包括音频结果数据。9.根据权利要求1所述的方法,其中所述通信数据包括文本数据,并且所述结果数据包括文本结果数据。10.根据权利要求1所述的方法,其中所述结果数据包括由语音响应合成模块基于文本结果数据提供的音频数据。11.一种或多种非暂态计算机可读存储介质,耦合到一个或多个处理器并且具有在其上存储的指令,所述指令在由所述一个或多个处理器执行时使得所述一个或多个处理器执行用于提供基于人工智能(AI)的数字助理的操作,所述操作包括:从设备接收通信数据,所述通信数据包括由所述设备的用户输入的数据;基于所述通信数据接收文本数据;基于通过人工智能服务处理所述文本数据来提供意图集合和实体集合,所述意图集合包括在所述文本数据中指示的一个或多个意图,所述实体集合包括在所述文本数据中指示的一个或多个实体,所述人工智能服务实现一个或多个卷积神经网络(CNN);基于所述文本数据、所述意图集合和所述实体集合中的一项或多项来标识动作集合,所述动作集合包括要由一个或多个计算机实现的服务执行的一个或多个动作;接收结果集合,所述结果集合包括来自执行所述动作集合中的动作的计算机实现的服务的至少一个结果;提供包括描述所述至少一个结果的数据的结果数据;以及向所述设备传输所述结果数据。12.根据权利要求11所述的计算机可读存储介质,其中所述人工智能服务包括使用自然语言处理(NLP)来提供所述意图集合的意...

【专利技术属性】
技术研发人员:M·L·马加T·M·萨拉马F·罗西
申请(专利权)人:埃森哲环球解决方案有限公司
类型:发明
国别省市:爱尔兰,IE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1