用于训练模型的基于有向无环图的框架制造技术

技术编号:26173004 阅读:57 留言:0更新日期:2020-10-31 13:53
本公开涉及一种用于训练模型的基于有向无环图(DAG)的框架。本公开涉及用于聊天机器人的技术,并且更具体地,用于使用基于DAG的框架来构建并训练模型的技术。在一个特定方面,提供了一种计算机实施的方法,该方法包括通过基于DAG的框架生成第一模型和第二模型、在运行时间内执行用于聊天机器人的第一模型并且在设计时间内执行用于聊天机器人的第二模型、在聊天机器人运行第一模型和第二模型时收集用于与一组话语相关联的意图分类的属性、使用一个或多个度量基于对用于意图分类的属性的分析来评估第一模型和第二模型的性能、确定第二模型与第一模型相比性能是否有所提高、以及基于性能确定在运行时间内执行用于聊天机器人的第一模型或第二模型。

【技术实现步骤摘要】
用于训练模型的基于有向无环图的框架相关申请的交叉引用本申请是于2019年4月26日提交的名称为“DIRECTEDACYCLICGRAPHBASEDFRAMEWORKFORTRAININGMODELS(用于训练模型的基于有向无环图的框架)”的美国临时申请号62/839,377的非临时申请并且根据35U.S.C.119(e)要求所述美国临时申请的权益和优先权。出于所有目的,前述申请的全部内容通过引用以其全文并入本文。
本公开总体上涉及训练聊天机器人,并且更具体地,涉及用于使用基于有向无环图(DAG)的框架来构建并训练聊天机器人的模型的技术。
技术介绍
为了获得即时反应,世界各地的许多用户使用即时消息传递或聊天平台。组织经常使用这些即时消息传递或聊天平台与客户(或最终用户)进行实时会话。然而,雇用服务人员与客户或最终用户进行实时交流对于组织来说会是非常昂贵的。已经开始开发聊天机器人或机器人来模拟与最终用户的会话,尤其是通过因特网。最终用户可以通过最终用户已经安装并使用的消息传递应用程序与机器人交流。智能机器人(通常通过人工智能(AI)提供动力)可以在实时会话中更智能地且根据背景进行交流并且因此可以允许机器人与最终用户之间进行更加自然的会话以改善会话体验。不是最终用户去学习机器人知道如何作出回应的固定的一组关键词或命令,而是智能机器人可以能够基于自然语言的用户话语来理解最终用户的意图并且相应地作出回应。
技术实现思路
提供了用于使用基于DAG的框架来构建并训练用于聊天机器人的模型的技术(例如,一种方法、系统、非暂态计算机可读介质,所述非暂态计算机可读介质存储有可由一个或多个处理器执行的代码或指令)。在各种实施例中,提供了一种计算机实施的方法,所述计算机实施的方法包括:通过集成计算系统的基于有向无环图的框架生成第一模型和第二模型,其中,所述第一模型是用于执行与聊天机器人相关联的一个或多个操作的第一组任务的流水线并且所述第二模型是用于执行与所述聊天机器人相关联的所述一个或多个操作的第二组任务的流水线;通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第一模型并且在设计时间内执行用于所述聊天机器人的所述第二模型;在所述聊天机器人运行所述第一模型和所述第二模型时通过所述集成计算系统的事件收集器收集用于与一组话语相关联的意图分类的一个或多个属性;通过所述集成计算系统的使用一个或多个度量的分析引擎基于对用于所述意图分类的所述一个或多个属性的分析来评估所述第一模型和所述第二模型的性能;通过所述分析引擎基于所述评估确定所述第二模型的所述性能与所述第一模型的所述性能相比有所提高;以及通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第二模型。在一些实施例中,所述方法进一步包括:以图形方式在GUI上显示所述第一模型的所述流水线;以及通过所述GUI接收对一个或多个用户可选任务的用户选择;以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第一组任务。在一些实施例中,所述方法进一步包括:以图形方式在GUI上显示所述第二模型的所述流水线;以及通过所述GUI接收对一个或多个用户可选任务的用户选择;以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第二组任务。在一些实施例中,所述方法进一步包括:通过一个或多个用户可选项中的用户可选项接收用户输入;以及基于所述用户输入训练所述第一模型和所述第二模型,其中,所述用户输入是用户考虑用于触发意图的一组话语。在一些实施例中,在运行时间内运行的所述第一模型在数据集上执行以生成由所述聊天机器人在下游过程中使用的输出,其中,所述下游过程包括基于所述意图分类提供对话或采取行动,并且其中,在设计时间内在后台运行的所述第二模型在相同的数据集上执行以生成不同的输出,所述不同的输出不会由所述聊天机器人在所述下游过程中使用。在一些实施例中,所述第一组任务与所述第二组任务不同,并且不同之处在于至少一个任务的添加或减少、至少一个任务的替换、处理至少一个任务的顺序、或其组合。在一些实施例中,所述执行所述第一模型和所述第二模型包括从一个或多个通道获取包括所述一组话语的数据集或从数据库获取包括所述一组话语的所述数据集,以及基于所述一组话语使用所述第一模型和所述第二模型解析意图。在各种实施例中,提供了一种系统,所述系统包括一个或多个数据处理器和包含指令的非暂态计算机可读存储介质,所述指令当在所述一个或多个数据处理器上执行时使所述一个或多个数据处理器执行本文所公开的一种或多种方法的部分或全部。在各种实施例中,提供了一种计算机程序产品,所述计算机程序产品有形地体现在非暂态机器可读存储介质中并且包括被配置成使一个或多个数据处理器执行本文所公开的一种或多种方法的部分或全部的指令。本公开的一些实施例包括一种系统,所述系统包括一个或多个数据处理器。在一些实施例中,所述系统包括包含指令的非暂态计算机可读存储介质,所述指令当在所述一个或多个数据处理器上执行时使所述一个或多个数据处理器执行本文所公开的一种或多种方法的部分或全部和/或一个或多个过程的部分或全部。本公开的一些实施例包括一种有形地体现在非暂态机器可读存储介质中的计算机程序产品,所述计算机程序产品包括被配置成使一个或多个数据处理器执行本文所公开的一种或多种方法的部分或全部和/或一个或多个过程的部分或全部的指令。可以用多种方式并且在多种背景下实施上文和下文所描述的技术。如下文更详细地描述的,参考以下附图提供了几种示例实施方式和背景。然而,以下实施方式和背景仅是许多实施方式和背景中的一些。附图说明图1描绘了根据各种实施例的分布式环境的简化框图。图2描绘了根据各种实施例的包括机器人系统和用于监测、分析、可视化并提高机器人系统的性能的机器人分析系统的集成系统。图3描绘了根据各种实施例的流水线。图4描绘了根据各种实施例的无效流水线。图5描绘了根据各种实施例的用于节点的名称检查过程。图6描绘了根据各种实施例的复杂流水线。图7图示了根据各种实施例的用于构建、训练并实施一个或多个模型的过程流程。图8描绘了用于实施各种实施例的分布式系统的简化图。图9是根据各种实施例的系统环境的一个或多个部件的简化框图,通过所述系统环境,由实施例系统的一个或多个部件提供的服务可以作为云服务提供。图10图示了可以用于实施各种实施例的示例计算机系统。具体实施方式在以下描述中,出于解释的目的,阐述了具体细节以便提供对某些实施例的透彻理解。然而,将显而易见的是,可以在没有这些具体细节的情况下实践各种实施例。附图和描述不旨在是限制性的。词语“示例性”在本文中用来意指“用作示例、实例或例示”。在本文中被描述为“示例性”的任何实施例或设计不必被解释为比其他实施例或设计更优选或有利。本文档来自技高网...

【技术保护点】
1.一种用于聊天机器人的方法,包括:/n通过集成计算系统的基于有向无环图的框架生成第一模型和第二模型,其中,所述第一模型是用于执行与聊天机器人相关联的一个或多个操作的第一组任务的流水线并且所述第二模型是用于执行与所述聊天机器人相关联的所述一个或多个操作的第二组任务的流水线;/n通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第一模型并且在设计时间内执行用于所述聊天机器人的所述第二模型;/n在所述聊天机器人运行所述第一模型和所述第二模型时通过所述集成计算系统的事件收集器收集用于与一组话语相关联的意图分类的一个或多个属性;/n通过所述集成计算系统的分析引擎使用一个或多个度量基于对用于所述意图分类的所述一个或多个属性的分析来评估所述第一模型的性能和所述第二模型的性能;/n通过所述分析引擎基于所述评估确定所述第二模型的性能与所述第一模型的性能相比有所提高;以及/n通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第二模型。/n

【技术特征摘要】
20190426 US 62/839,377;20200319 US 16/823,6111.一种用于聊天机器人的方法,包括:
通过集成计算系统的基于有向无环图的框架生成第一模型和第二模型,其中,所述第一模型是用于执行与聊天机器人相关联的一个或多个操作的第一组任务的流水线并且所述第二模型是用于执行与所述聊天机器人相关联的所述一个或多个操作的第二组任务的流水线;
通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第一模型并且在设计时间内执行用于所述聊天机器人的所述第二模型;
在所述聊天机器人运行所述第一模型和所述第二模型时通过所述集成计算系统的事件收集器收集用于与一组话语相关联的意图分类的一个或多个属性;
通过所述集成计算系统的分析引擎使用一个或多个度量基于对用于所述意图分类的所述一个或多个属性的分析来评估所述第一模型的性能和所述第二模型的性能;
通过所述分析引擎基于所述评估确定所述第二模型的性能与所述第一模型的性能相比有所提高;以及
通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第二模型。


2.如权利要求1所述的方法,进一步包括:以图形方式在GUI上显示所述第一模型的所述流水线;以及通过所述GUI接收对一个或多个用户可选任务的用户选择;以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第一组任务。


3.如权利要求1所述的方法,进一步包括:以图形方式在GUI上显示所述第二模型的所述流水线;以及通过所述GUI接收对一个或多个用户可选任务的用户选择;以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第二组任务。


4.如权利要求1所述的方法,进一步包括:通过一个或多个用户可选项中的用户可选项接收用户输入;以及基于所述用户输入训练所述第一模型和所述第二模型,其中,所述用户输入是用户考虑以触发意图的一组话语。


5.如权利要求1所述的方法,其中,在运行时间内运行的所述第一模型在数据集上执行以生成待由所述聊天机器人在下游过程中使用的输出,其中,所述下游过程包括基于所述意图分类提供对话或采取行动,并且其中,在设计时间内在后台运行的所述第二模型在相同的数据集上执行以生成不同的输出,所述不同的输出不会被所述聊天机器人在所述下游过程中使用。


6.如权利要求1所述的方法,其中,所述第一组任务与所述第二组任务不同,并且不同之处在于至少一个任务的添加或减少、至少一个任务的替换、处理至少一个任务的顺序、或其组合。


7.如权利要求1所述的方法,其中,所述执行所述第一模型和所述第二模型包括从一个或多个通道获取包括所述一组话语的数据集或从数据库获取包括所述一组话语的所述数据集,以及基于所述一组话语使用所述第一模型和所述第二模型解析意图。


8.一种非暂态计算机可读存储器,其存储能够由一个或多个处理器执行的多个指令,所述多个指令包括当由所述一个或多个处理器执行时使所述一个或多个处理器执行包括以下操作的处理的指令:
通过集成计算系统的基于有向无环图的框架生成第一模型和第二模型,其中,所述第一模型是用于执行与聊天机器人相关联的一个或多个操作的第一组任务的流水线并且所述第二模型是用于执行与所述聊天机器人相关联的所述一个或多个操作的第二组任务的流水线;通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第一模型并且在设计时间内执行用于所述聊天机器人的所述第二模型;在所述聊天机器人运行所述第一模型和所述第二模型时通过所述集成计算系统的事件收集器收集用于与一组话语相关联的意图分类的一个或多个属性;
通过所述集成计算系统的分析引擎使用一个或多个度量基于对用于所述意图分类的所述一个或多个属性的分析来评估所述第一模型的性能和所述第二模型的性能;
通过所述分析引擎基于所述评估确定所述第二模型的性能与所述第一模型的性能相比有所提高;以及
通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第二模型。


9.如权利要求8所述的非暂态计算机可读存储器,其中,所述处理进一步包括:以图形方式在GUI上显示所述第一模型的所述流水线;以及通过所述GUI接收对一个或多个用户可选任务的用户选择;以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第一组任务。


10.如权利要求8所述的非暂态...

【专利技术属性】
技术研发人员:G·辛格拉朱C·潘
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1