训练精炼的机器学习模型制造技术

技术编号：12531087 阅读：59 留言：0更新日期：2015-12-18 02:36

一种用于训练精炼的机器学习模型的方法、系统和装置，包括编码在计算机存储媒体上的计算机程序。其中一个方法包括训练繁冗的机器学习模型，其中该繁冗的机器学习模型被配置为接收输入并生成针对多个分类中的每个的相应的分数；以及在多个训练输入上训练精炼的机器学习模型，其中该精炼的机器学习模型也被配置为接收输入并生成针对所述多个分类的分数，包括：使用繁冗的机器学习模型处理每个训练输入以生成针对该训练输入的繁冗的目标软输出；以及训练精炼的机器学习模型以针对每个训练输入生成与针对该训练输入的该繁冗的目标软输出匹配的软输出。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及训练机器学习模型。
技术介绍
机器学习模型接收输入并基于所接收的输入和模型的参数值生成输出。例如，机器学习模型可接收图像并生成针对每个分类集合的分数，针对给定分类的分数表示该图像中包含属于该分类的对象的图像的概率。机器学习模型可由例如线性或非线性操作的单个级别组成或者可为深度网络，即由多个级别组成的机器学习模型，其中的一个或多个可为非线性操作的层。深度网络的一个示例是具有一个或多个隐藏层的神经网络。
技术实现思路
总的来说，本说明书描述了用于使用繁冗的机器学习模型训练精炼的机器学习模型的技术。可实施本说明书中描述的主题的特定实施例以便实现一个或多个下述优点。精炼的机器学习模型相对于繁冗的机器学习模型，更易于部署，即，因为它比繁冗的机器学习模型需要更少的计算、存储或者两者兼有，从而在运行时间生成输出，该精炼的机器学习模型可使用已被训练的繁冗的神经网络进行有效的训练。一旦使用繁冗的机器学习模型进行了训练，精炼的机器学习模型能够生成精度不显著低于通过繁冗的机器学习模型生成的输出的输出，尽管它比繁冗的机器学习模型更易于部署或者使用更少的计算资源。包括一个或多个全机器学习模型和一个或多个专业机器学习模型的集成模型可更精确地生成分数以对所接收的输入进行分类。特别地，通过在集成模型中包括专业机器学习模型，可更精确地生成针对频繁地被全机器学习模型预测为在一起或者混淆的分类的分数。在附图和下文的描述中提出本说明书的主题的一个或多个实施例的细节。通过该描述、附图以及权利要求，主题的其他特征、方面和优点将变得显而易...

【技术保护点】
一种由一个或多个计算机执行的方法，所述方法包括：训练繁冗的机器学习模型，其中所述繁冗的机器学习模型被配置为接收输入并生成针对多个分类中的每个的相应的分数；以及在多个训练输入上训练精炼的机器学习模型，其中所述精炼的机器学习模型也被配置为接收输入并生成针对所述多个分类的分数，包括：使用所述繁冗的机器学习模型处理每个训练输入以生成针对该训练输入的繁冗的目标软输出；以及训练所述精炼的机器学习模型以针对每个训练输入生成与针对该训练输入的繁冗的目标软输出匹配的软输出。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：奥里奥尔·温亚尔斯，杰弗里·阿德盖特·迪恩，杰弗里·E·欣顿，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人