System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 预训练深度学习模型的自动微调和部署制造技术_技高网

预训练深度学习模型的自动微调和部署制造技术

技术编号:40323943 阅读:20 留言:0更新日期:2024-02-09 14:18
一种云平台包括多个web服务,web服务有助于对针对软件工程任务配置的预训练深度学习模型进行自动调优和部署。自动调优和部署允许开发人员在不访问预先存在且经微调的模型的参数的情况下,以不需要用户管理输入的方式对预先存在的模型进行微调。云平台为每个预训练模型提供文件集,文件集被用于在无需用户输入的情况下自动构建用于对模型进行微调的微调基础结构以及部署了经微调的模型的部署基础结构。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、深度学习模型通常被用于解决各种问题。深度学习模型采用被训练来学习、识别模式和进行预测的神经网络。这些模型的一个缺点是训练模型需要大量的时间和资源。模型可能需要由从各种源挖掘的数百万个数据样本组成的真实世界数据的训练数据集。训练本身可能需要数天到数周的计算时间以及资源。神经网络以迭代方式训练,在收敛到最小值之前对训练数据集进行多次传递。训练是迭代的,并且整个训练数据集通过神经网络进行多次迭代,以找到满足对象目标的超参数(例如,模型架构、词汇编码过程、训练目标、数据归一化)。

2、为了减少开发深度学习模型的训练时间和成本,经常使用迁移学习。在迁移学习中,预训练(pre-trained)模型被用作相关任务的起点。预训练模型然后使用相关任务的监督数据集来进行训练或微调。预训练模型的参数被再次使用,从而节省了大量的训练时间和资源消耗。但是,需要大量的专业知识来针对特定任务正确地微调预训练模型。该专业知识为没有这种专业知识的个人再次使用预训练模型造成了障碍。


技术实现思路

1、本
技术实现思路
旨在以简化形式介绍一系列概念,这些概念将在以下具体实施方式中被进一步描述。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。

2、云平台提供了web服务,web服务用于使得能够在没有用户配置输入的情况下自动微调、部署和执行为软件工程任务定制的预训练深度学习模型。云平台在无需用户(例如,开发人员、客户、客户端等)指定基础结构(infrastructure)配置的情况下,构建了用于对预训练深度学习模型进行微调的微调基础结构、部署了经微调的深度学习模型的部署基础结构以及利用用户的推理数据集来运行模型的模型执行服务。

3、云平台提供了模型文件、分词器(tokenizer)、脚本以及相关的环境定义和程序包(package),用于在不允许访问模型的内部数据结构的情况下,对预训练模型进行微调,在云平台的虚拟机上部署模型并且在用户的推理数据集上执行模型。通过这种方式,云平台能够在没有向用户公开模型的内部参数的情况下为机器学习专业知识有限的用户提供调优、部署和执行基础结构的自动构建。

4、通过阅读以下详细说明和查看相关附图,这些特征和优势以及其他特征和优势将是显而易见的。应理解,上述整体描述和以下详细描述两者仅是解释性的,并不限制所要求保护的各方面。

本文档来自技高网...

【技术保护点】

1.一种系统,包括:

2.根据权利要求1所述的系统,其中所述一个或多个程序包括用于执行以下动作的指令:

3.根据权利要求2所述的系统,其中所述一个或多个程序包括另外的指令,所述另外的指令:

4.根据权利要求1所述的系统,其中所述预训练深度学习模型中的每个预训练深度学习模型包括环境定义文件、微调脚本、部署脚本和分词器。

5.根据权利要求1所述的系统,其中所述多个预训练深度学习模型包括具有注意力的编码器神经转换器、具有注意力的解码器神经转换器和/或具有注意力的编码器-解码器神经转换器。

6.根据权利要求1所述的系统,其中所述自动微调基础结构包括一个或多个虚拟机、虚拟操作系统、以及用于所述一个或多个虚拟机的工具和/或程序包。

7.根据权利要求1所述的系统,其中所述自动微调基础结构包括预处理引擎,用于对用于所述预训练深度学习模型中的所述所选择的预训练深度学习模型的所述自定义数据集进行处理。

8.根据权利要求1所述的系统,其中所述参数包括权重、偏差和/或嵌入。

9.一种在计算设备上执行的方法,所述计算设备具有处理器和存储器,所述方法包括:

10.根据权利要求9所述的方法,还包括:

11.根据权利要求10所述的方法,还包括:

12.根据权利要求11所述的方法,还包括:

13.根据权利要求9所述的方法,其中所述多个深度学习模型包括具有注意力的编码器神经转换器模型、解码器神经转换器模型以及具有注意力的编码器-解码器神经转换器模型。

...

【技术特征摘要】
【国外来华专利技术】

1.一种系统,包括:

2.根据权利要求1所述的系统,其中所述一个或多个程序包括用于执行以下动作的指令:

3.根据权利要求2所述的系统,其中所述一个或多个程序包括另外的指令,所述另外的指令:

4.根据权利要求1所述的系统,其中所述预训练深度学习模型中的每个预训练深度学习模型包括环境定义文件、微调脚本、部署脚本和分词器。

5.根据权利要求1所述的系统,其中所述多个预训练深度学习模型包括具有注意力的编码器神经转换器、具有注意力的解码器神经转换器和/或具有注意力的编码器-解码器神经转换器。

6.根据权利要求1所述的系统,其中所述自动微调基础结构包括一个或多个虚拟机、虚拟操作系统、以及用于所述一个或多个虚拟机的工具和/或程序包。

【专利技术属性】
技术研发人员:C·B·克莱门特S·K·邓D·德雷恩N·森达雷桑A·斯维亚特科夫斯基田一丁M·图法诺P·AC·王吴晨尤东江
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1