经由机器学习语言模型的链的透明且可控的人智交互制造技术

技术编号：36870155 阅读：14 留言：0更新日期：2023-03-15 19:45

本公开涉及经由机器学习语言模型的链接的透明且可控的人智交互。本公开提供经由机器学习语言模型的链的透明且可控的人智交互。特别地，尽管现有语言模型(例如，所谓的“大型语言模型”(LLM))在简单任务上展示令人印象深刻的潜力，但是当辅助人类进行更复杂的任务时，它们的范围广度、缺乏透明度和不充足的可控性能够使它们不太有效。作为响应，本公开引入了将机器学习语言模型(例如，LLM)的实例化链接在一起的概念，其中一个实例化的输出变成下一实例化的输入，依此类推，从而每步聚合增益。从而每步聚合增益。从而每步聚合增益。

全部详细技术资料下载

【技术实现步骤摘要】
经由机器学习语言模型的链的透明且可控的人智交互
[0001]相关申请
[0002]本申请基于并且要求具有申请2021年10月1日的美国临时专利申请 No.63/251,264和具有申请日2022年3月2日的美国临时专利申请No. 63/315,648中的每一个的权益，它们中的每一个以其全文通过引用并入本文。

[0003]本公开总体涉及经由机器学习的语言建模。更具体地，本公开涉及经由机器学习语言模型的链的透明且可控的人智交互，在一些实例中，包括用于定期地构建和/或编辑包括一个或多个机器学习语言模型的实例化序列的模型链的图形用户界面。

技术介绍

[0004]语言模型包括对语言进行建模的模型(例如，机器学习模型)。例如，语言模型能够接收和处理输入数据以生成输出数据，其中输入数据和/或输出数据以诸如例如自然语言(例如，英语、法语、普通话等)或编程语言 (例如，C+、Java、Python等)等语言来表达。
[0005]最近，(例如，在参数数量、训练数据容量、架构复杂度等方面)明显很大的机器学习语言模型已经提供了高质量的语言建模。这些明显很大的模型在本领域中被称为大型语言模型(LLM)。
[0006]LLM已经为人智协作引入了新可能性。对(例如，来自互联网的) 大量(例如，数十亿)输入进行预训练，像GPT
‑
3的LLM现在能够执行各种各样的任务，范围从翻译到问答，甚至是高级的故事书写。它们的成功来自于它们纯粹使用提示(例如，其可以是任务的自然语言描述)来适应各种期望任务的能力。...

【技术保护点】

【技术特征摘要】
1.一种链接一个或多个机器学习语言模型以提供改进的可解释性的计算系统，所述计算系统包括：一个或多个处理器；以及共同存储指令的一个或多个非暂时性计算机可读介质，所述指令在由所述一个或多个处理器执行时使所述计算系统执行操作，所述操作包括：接收初始语言输入；利用模型链处理所述初始语言输入以生成语言输出，其中，所述模型链包括一个或多个机器学习语言模型的多个模型实例化，其中，每个模型实例化被配置为接收和处理模型输入以生成模型输出，其中，所述模型输入的至少一部分包括描述由所述模型实例化在所述模型输入上执行以生成所述模型输出的任务的模型提示，以及其中，所述模型链中的所述多个模型实例化被顺序地排列，使得除了所述模型链中的初始模型实例化之外，所述模型链中的每个模型实例化的相应模型输入包括来自所述模型链中的顺序上先前的模型实例化的相应模型输出；以及提供所述语言输出作为输出。2.根据权利要求1所述的计算系统，其中，所述操作还包括：提供用户界面，所述用户界面被配置为提供所述模型链的可视化并且接收用于所述模型链的模块化构造的用户输入。3.根据权利要求1所述的计算系统，其中，所述操作还包括：提供用户界面，所述用户界面被配置为接收用于编辑对所述模型链中的每个模型实例化的相应模型提示的用户输入。4.根据权利要求1所述的计算系统，其中，对所述模型链中的每个模型实例化的相应模型提示是用户能从与原语子任务相对应的多个预定义模板提示中选择的。5.根据权利要求1所述的计算系统，其中，所述操作还包括：提供用户界面，所述用户界面可视化并且能够编辑所述模型链中的所述多个模型实例化中的至少一个的相应模型输出；经由所述用户界面接收修改所述模型链中的所述多个模型实例化中的所述至少一个的所述相应模型输出的用户输入；以及在将所述相应模型输出输入到所述模型链中的顺序上后续模型实例化中之前，根据所述用户输入来修改所述相应模型输出。6.根据权利要求5所述的计算系统，其中，响应于接收到的用户输入，所述操作还包括：改变所述模型链中的所述多个模型实例化中的所述至少一个的所述相应模型输出的内容；从所述模型链中的所述多个模型实例化中的所述至少一个的所述相应模型输出中删除内容；或者将内容添加到所述模型链中的所述多个模型实例化中的所述至少一个的所述相应模型输出。7.根据权利要求1所述的计算系统，其中：所述一个或多个机器学习语言模型包括单个机器学习语言模型；以及
所述多个模型实例化包括所述单个机器学习语言模型的多个模型实例化。8.根据权利要求1所述的计算系统，其中：所述一个或多个机器学习语言模型包括两个或更多个不同的机器学习语言模型；以及所述多个模型实例化包括所述两个或更多个不同的机器学习语言模型的多个模型实例化。9.根据权利要求1所述的计算系统，其中：所述模型链被配置为对所述初始语言输入执行元任务以生成所述语言输出；以及所述模型链中的所述一个或多个机器学习语言模型的所述多个模型实例化中的每一个被配置为执行所述元任务的多个不同组件子任务中的相应一个。...

【专利技术属性】
技术研发人员：卡里，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人