【技术实现步骤摘要】
数据处理方法、装置、存储介质和处理器
[0001]本专利技术涉及数据处理领域,具体而言,涉及一种数据处理方法、装置、存储介质和处理器。
技术介绍
[0002]目前,在分类数较少,通过单台图形处理器(Graphics Processing Unit,简称为GPU)进行训练时,采用随机梯度下降(Stochastic Gradient Descent,简称为SGD)方法进行收敛的速度比较慢,训练时间也比较长。
[0003]而在分类数较多,单台GPU机器无法训练,需要多台GPU机器并行计算时,采用SGD方法的网络传输开销也比较高,并且训练的迭代收敛轮数也较多,从而存在对任务进行分类的效率低的技术问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0005]本专利技术实施例提供了一种数据处理方法、装置、存储介质和处理器,以至少解决对任务进行分类的效率低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种数据处理方法。该方法可以包括:在目标模型中确定出 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:在目标模型中确定出分类层;基于目标任务确定所述分类层的原始参数;对所述原始参数进行初始化,得到目标参数;基于具有所述目标参数的所述分类层对所述目标任务进行分类,得到所述目标任务的分类结果;基于所述分类结果输出所述目标任务所指示的目标对象的信息。2.根据权利要求1所述的方法,其特征在于,对所述原始参数进行初始化,得到目标参数,包括:对所述原始参数进行随机初始化,得到所述目标参数。3.根据权利要求1所述的方法,其特征在于,对所述原始参数进行初始化,得到目标参数,包括:获取所述分类层的特征数据和对应的标签;将所述原始参数、所述特征数据和所述标签输入至损失函数中,得到所述目标参数。4.根据权利要求3所述的方法,其特征在于,将所述原始参数、所述特征数据和所述标签输入至损失函数中,得到所述目标参数,包括:基于交叉熵损失函数对所述原始参数、所述特征数据和所述标签进行训练,得到所述目标参数。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:从所述目标参数中确定出目标列参数,其中,所述目标列参数为所述目标参数中多列参数中的任一列参数;对所述目标列参数进行更新,其中,更新后的所述目标列参数的性能优于更新前的所述目标列参数,所述目标参数中除所述目标列参数之外的列参数保持不变。6.根据权利要求5所述的方法,其特征在于,更新后的所述目标列参数的损失比更新前的所述目标列参数的损失小。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:对所述目标参数中的所述多列参数进行循环更新。8.根据权利要求5所述的方法,其特征在于,对所述目标列参数进行更新,包括:获取所述目标列参数对应的更新概率;基于所述更新概率对所述目标参数进行更新。9.根据权利要求8所述的方法,其特征在于,通过目标因子使得更新后的所述目标参数对应的函数线性收敛。10.根据权利要求8所述的方法,其特征在于,基于所述更新概率对所述目标参数进行更新,包括:确定与所述更新概率对应的逆矩阵;基于所述逆矩阵对所述目标参数进行更新。11.根据权利要求1至9中任意一项所述的方法,其特征在于,在对所述原始参数进行初始化的过程中,所述目标模型中除所述分类层之外的层的参数保持不变。12.根据权利要求1至9中任意一项所述的方法,其特征在于,所述目标参数通过凸函数
进行表示。13.一种数据处理方法,其特征在于,包括:在人脸识别模型中确定出分类层,其中,所述人脸识别模型用于对输入的人脸图像进行识别;基于目标人脸图像确定所述分类层的原始识别参数;对所述原始识别参数进行初始化,得到目标识别参数;基于具有所述目标识别参数的所述分类层对所述目标人脸图像进行识别,得到所述目标人脸图像的识别结果;基于所述识别结果输出所述目标人脸图像所指示的人脸对象的信息。14.根据权利要求13所述的方法,其特征在于,对所述原始识别参数进行初始化,得到目标识别参数,包括:对所述原始识别参数进行随机初始化,得到所述目标识别参数。15.根据权利要求13所述的方法,其特征在于,对所述原始识别参数进行初始化,得到目标识别参数,包括:获取所述分类层的人脸图像特征数据和对应的标签;将所述原始识别参数、所述人脸图像特征数据和所述标签输入至损失函数中,得到所述目标识别参数。16.一种数据处理方法,其特征在于,包括:在对象识别模型中确定出分类层,其中,所述对象识别模型用于对输入的标识进行识别;基于目标标识确定所述分类层的原始识别参数;对所述原始识别参数进行初始化,得到...
【专利技术属性】
技术研发人员:钱祺,徐渊鸿,李昊,金榕,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。