用于训练模型的基于有向无环图的框架制造技术

技术编号：26173004 阅读：57 留言：0更新日期：2020-10-31 13:53

本公开涉及一种用于训练模型的基于有向无环图(DAG)的框架。本公开涉及用于聊天机器人的技术，并且更具体地，用于使用基于DAG的框架来构建并训练模型的技术。在一个特定方面，提供了一种计算机实施的方法，该方法包括通过基于DAG的框架生成第一模型和第二模型、在运行时间内执行用于聊天机器人的第一模型并且在设计时间内执行用于聊天机器人的第二模型、在聊天机器人运行第一模型和第二模型时收集用于与一组话语相关联的意图分类的属性、使用一个或多个度量基于对用于意图分类的属性的分析来评估第一模型和第二模型的性能、确定第二模型与第一模型相比性能是否有所提高、以及基于性能确定在运行时间内执行用于聊天机器人的第一模型或第二模型。

全部详细技术资料下载

【技术实现步骤摘要】
用于训练模型的基于有向无环图的框架相关申请的交叉引用本申请是于2019年4月26日提交的名称为“DIRECTEDACYCLICGRAPHBASEDFRAMEWORKFORTRAININGMODELS(用于训练模型的基于有向无环图的框架)”的美国临时申请号62/839,377的非临时申请并且根据35U.S.C.119(e)要求所述美国临时申请的权益和优先权。出于所有目的，前述申请的全部内容通过引用以其全文并入本文。
本公开总体上涉及训练聊天机器人，并且更具体地，涉及用于使用基于有向无环图(DAG)的框架来构建并训练聊天机器人的模型的技术。
技术介绍
为了获得即时反应，世界各地的许多用户使用即时消息传递或聊天平台。组织经常使用这些即时消息传递或聊天平台与客户(或最终用户)进行实时会话。然而，雇用服务人员与客户或最终用户进行实时交流对于组织来说会是非常昂贵的。已经开始开发聊天机器人或机器人来模拟与最终用户的会话，尤其是通过因特网。最终用户可以通过最终用户已经安装并使用的消息传递应用程序与机器人交流。智能机器人(通常通过人工智能(AI)提供动力)可以在实时会话中更智能地且根据背景进行交流并且因此可以允许机器人与最终用户之间进行更加自然的会话以改善会话体验。不是最终用户去学习机器人知道如何作出回应的固定的一组关键词或命令，而是智能机器人可以能够基于自然语言的用户话语来理解最终用户的意图并且相应地作出回应。
技术实现思路
提供了用于使用基于DAG的框架来构建并训练用于聊天机器人的模型的技术(例...

【技术保护点】
1.一种用于聊天机器人的方法，包括：/n通过集成计算系统的基于有向无环图的框架生成第一模型和第二模型，其中，所述第一模型是用于执行与聊天机器人相关联的一个或多个操作的第一组任务的流水线并且所述第二模型是用于执行与所述聊天机器人相关联的所述一个或多个操作的第二组任务的流水线；/n通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第一模型并且在设计时间内执行用于所述聊天机器人的所述第二模型；/n在所述聊天机器人运行所述第一模型和所述第二模型时通过所述集成计算系统的事件收集器收集用于与一组话语相关联的意图分类的一个或多个属性；/n通过所述集成计算系统的分析引擎使用一个或多个度量基于对用于所述意图分类的所述一个或多个属性的分析来评估所述第一模型的性能和所述第二模型的性能；/n通过所述分析引擎基于所述评估确定所述第二模型的性能与所述第一模型的性能相比有所提高；以及/n通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第二模型。/n

【技术特征摘要】
20190426 US 62/839,377;20200319 US 16/823,6111.一种用于聊天机器人的方法，包括：
通过集成计算系统的基于有向无环图的框架生成第一模型和第二模型，其中，所述第一模型是用于执行与聊天机器人相关联的一个或多个操作的第一组任务的流水线并且所述第二模型是用于执行与所述聊天机器人相关联的所述一个或多个操作的第二组任务的流水线；
通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第一模型并且在设计时间内执行用于所述聊天机器人的所述第二模型；
在所述聊天机器人运行所述第一模型和所述第二模型时通过所述集成计算系统的事件收集器收集用于与一组话语相关联的意图分类的一个或多个属性；
通过所述集成计算系统的分析引擎使用一个或多个度量基于对用于所述意图分类的所述一个或多个属性的分析来评估所述第一模型的性能和所述第二模型的性能；
通过所述分析引擎基于所述评估确定所述第二模型的性能与所述第一模型的性能相比有所提高；以及
通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第二模型。

2.如权利要求1所述的方法，进一步包括：以图形方式在GUI上显示所述第一模型的所述流水线；以及通过所述GUI接收对一个或多个用户可选任务的用户选择；以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第一组任务。

3.如权利要求1所述的方法，进一步包括：以图形方式在GUI上显示所述第二模型的所述流水线；以及通过所述GUI接收对一个或多个用户可选任务的用户选择；以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第二组任务。

4.如权利要求1所述的方法，进一步包括：通过一个或多个用户可选项中的用户可选项接收用户输入；以及基于所述用户输入训练所述第一模型和所述第二模型，其中，所述用户输入是用户考虑以触发意图的一组话语。

5.如权利要求1所述的方法，其中，在运行时间内运行的所述第一模型在数据集上执行以生成待由所述聊天机器人在下游过程中使用的输出，其中，所述下游过程包括基于所述意图分类提供对话或采取行动，并且其中，在设计时间内在后台运行的所述第二模型在相同的数据集上执行以生成不同的输出，所述不同的输出不会被所述聊天机器人在所述下游过程中使用。

6.如权利要求1所述的方法，其中，所述第一组任务与所述第二组任务不同，并且不同之处在于至少一个任务的添加或减少、至少一个任务的替换、处理至少一个任务的顺序、或其组合。

7.如权利要求1所述的方法，其中，所述执行所述第一模型和所述第二模型包括从一个或多个通道获取包括所述一组话语的数据集或从数据库获取包括所述一组话语的所述数据集，以及基于所述一组话语使用所述第一模型和所述第二模型解析意图。

8.一种非暂态计算机可读存储器，其存储能够由一个或多个处理器执行的多个指令，所述多个指令包括当由所述一个或多个处理器执行时使所述一个或多个处理器执行包括以下操作的处理的指令：
通过集成计算系统的基于有向无环图的框架生成第一模型和第二模型，其中，所述第一模型是用于执行与聊天机器人相关联的一个或多个操作的第一组任务的流水线并且所述第二模型是用于执行与所述聊天机器人相关联的所述一个或多个操作的第二组任务的流水线；通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第一模型并且在设计时间内执行用于所述聊天机器人的所述第二模型；在所述聊天机器人运行所述第一模型和所述第二模型时通过所述集成计算系统的事件收集器收集用于与一组话语相关联的意图分类的一个或多个属性；
通过所述集成计算系统的分析引擎使用一个或多个度量基于对用于所述意图分类的所述一个或多个属性的分析来评估所述第一模型的性能和所述第二模型的性能；
通过所述分析引擎基于所述评估确定所述第二模型的性能与所述第一模型的性能相比有所提高；以及
通过所述集成计算系统的所述基于有向无环图的框架在运行时间内执行用于所述聊天机器人的所述第二模型。

9.如权利要求8所述的非暂态计算机可读存储器，其中，所述处理进一步包括：以图形方式在GUI上显示所述第一模型的所述流水线；以及通过所述GUI接收对一个或多个用户可选任务的用户选择；以及基于所述用户选择以图形方式在所述GUI上显示在所述流水线中具有所述一个或多个用户可选任务的所述第一组任务。

10.如权利要求8所述的非暂态...

【专利技术属性】
技术研发人员：G·辛格拉朱，C·潘，
申请(专利权)人：甲骨文国际公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人