结构化卷积和相关联加速制造技术

技术编号：36585300 阅读：10 留言：0更新日期：2023-02-04 17:47

本公开的某些方面提供了用于执行机器学习的技术，包括：生成用于机器学习模型的卷积层的基掩码集合，其中每个基掩码包括二进制掩码；确定缩放因子集合，其中该缩放因子集合中的每个缩放因子对应于该基掩码集合中的基掩码；基于该基掩码集合和该缩放因子集合来生成复合核；以及基于该复合核来执行卷积运算。以及基于该复合核来执行卷积运算。以及基于该复合核来执行卷积运算。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】结构化卷积和相关联加速
[0001]相关申请的交叉引用
[0002]本申请要求于2020年6月2日提交的美国临时专利申请No.63/033,746、于2020年6月2日提交的美国临时专利申请No.63/033,751、以及于2021年6月1日提交的美国专利申请No.17/336,048的权益和优先权，其中每一件申请的全部内容通过援引纳入于此。
[0003]引言
[0004]本公开的各方面涉及机器学习模型。
[0005]机器学习可以产生经训练模型(例如，人工神经网络、树或其他结构)，其表示对先验已知的训练数据集合的广义拟合。将经训练模型应用于新数据产生推断，这可被用于获得关于新数据的洞察。在一些情形中，将模型应用于新数据被描述为对新数据“运行推断”。
[0006]机器学习模型被越来越多地用于各种领域，包括用于分类、检测和识别任务。例如，机器学习模型正被用于基于由电子设备上的一个或多个机载传感器所提供的传感器数据在这些设备上执行复杂任务，诸如自动检测图像内的特征(例如，面部)。
[0007]广泛部署和采用机器学习模型的关键挑战在于其计算复杂度，这通常要求高功率计算系统。不太强大的计算系统(诸如移动设备、可穿戴设备、物联网(IoT)设备、边缘处理设备等等)可能没有实现机器学习模型所必需的资源。
[0008]相应地，需要更高效的机器学习模型。
[0009]简要概述
[0010]某些方面提供了一种执行机器学习的方法，包括：生成用于机器学习模型的卷积层的基核集合，其中每个基核包括掩码和缩放因...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：生成用于机器学习模型的卷积层的基掩码集合，其中每个基掩码包括二进制掩码；确定缩放因子集合，其中所述缩放因子集合中的每个缩放因子对应于所述基掩码集合中的基掩码；基于所述基掩码集合和所述缩放因子集合来生成复合核；以及基于所述复合核来执行卷积运算。2.如权利要求1所述的方法，其中，基于所述复合核来执行所述卷积运算包括：接收输入数据；对于与所述复合核相关联的所述基掩码集合中的每个相应基掩码：基于所述相应基掩码来提取所述输入数据的子集以供处理；基于所述输入数据的针对所述相应基掩码的所述子集来计算所述相应基掩码的基和；以及通过向所述基和应用对应于所述相应基掩码的缩放因子来计算部分卷积层输出；以及通过对与所述基掩码集合中的每个基掩码相关联的每个部分卷积层输出进行求和来生成卷积层输出。3.如权利要求1所述的方法，其中：所述复合核包括结构化核；并且所述卷积运算包括结构化卷积。4.如权利要求3所述的方法，其中，所述卷积运算包括：接收输入数据；对所述输入数据执行求和池化运算以生成经求和池化输出数据；以及使用具有比所述输入数据的空间维度小的空间维度的卷积核来对所述经求和池化输出数据执行卷积运算。5.如权利要求1所述的方法，进一步包括：使用结构正则化项来训练所述机器学习模型。6.如权利要求1所述的方法，进一步包括：基于所述基掩码集合使用Toeplitz矩阵来训练所述机器学习模型。7.如权利要求1所述的方法，进一步包括：向所述卷积层应用结构分解以生成经分解卷积层；以及使用所述经分解卷积层和任务损失函数来训练所述机器学习模型。8.一种处理系统，包括：包括计算机可执行指令的存储器；一个或多个处理器，所述一个或多个处理器被配置成执行所述计算机可执行指令并使所述处理系统：生成用于机器学习模型的卷积层的基掩码集合，其中每个基掩码包括二进制掩码；确定缩放因子集合，其中所述缩放因子集合中的每个缩放因子对应于所述基掩码集合中的基掩码；基于所述基掩码集合和所述缩放因子集合来生成复合核；以及基于所述复合核来执行卷积运算。
9.如权利要求8所述的处理系统，其中，为了基于所述复合核来执行所述卷积运算，所述一个或多个处理器被进一步配置成使所述处理系统：接收输入数据；对于与所述复合核相关联的所述基掩码集合中的每个相应基掩码：基于所述相应基掩码来提取输入数据的子集以供处理；基于所述输入数据的针对所述相应基掩码的所述子集来计算所述相应基掩码的基和；以及通过向所述基和应用对应于所述相应基掩码的缩放因子来计算部分卷积层输出；以及通过对与所述基掩码集合中的每个基掩码相关联的每个部分卷积层输出进行求和来生成卷积层输出。10.如权利要求8所述的处理系统，其中：所述复合核包括结构化核；并且所述卷积运算包括结构化卷积。11.如权利要求10所述的处理系统，其中，为了执行所述结构化卷积运算，所述一个或多个处理器被进一步配置成使所述处理系统：接收输入数据；对所述输入数据执行求和池化运算以生成经求和池化输出数据；以及使用具有比所述输入数据的空间维度小的空间维度的卷积核来对所述经求和池化输出数据执行卷积运算。12.如权利要求8所述的处理系统，其中，所述一个或多个处理器被进一步配置成使所述处理系统使用结构正则化项来训练所述机器学习模型。13.如权利要求8所述的处理系统，其中，所述一个或多个处理器被进一步配置成使所述处理系统基于所述基掩码集合使用Toeplitz矩阵来训练所述机器学习模型。14.如权利要求8所述的处理系统，其中，所述一个或多个处理器被进一步配置成使所述处理系统：向所述卷积层应用结构分解以生成经分解卷积层；以及使用所述经分解卷积层和任务损失函数来训练所述机器学习模型。15.一种包括指令的非瞬态计算机可读介质，所述指令在由处理系统的一个或多个处理器执行时使所述处理系统执行...

【专利技术属性】
技术研发人员：Y，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人