利用缺失多标签数据实现多标签模型训练框架的实现方法技术

技术编号:25891330 阅读:59 留言:0更新日期:2020-10-09 23:33
本发明专利技术公开了利用缺失多标签数据实现多标签模型训练框架的实现方法,该方法整合多个单一标签数据集,形成不完整多标签数据集,采用共享分支网络结合非共享分支网络的结构,进行统一训练,实现对目标样本多标签进行同时输出的训练。本发明专利技术能够实现单一模型同时训练多个标签(属性),方便部署;且本发明专利技术的训练框架,采用共享权值分支的存在,共享权值分支只需要进行唯一一次前向传播计算,显著地降低了网络前向传播过程中的计算次数和计算资源消耗,也因为共享特征提取器的原因,共享了共享特征提取器所包含的网络参数,显著地减少了模型的大小。

【技术实现步骤摘要】
利用缺失多标签数据实现多标签模型训练框架的实现方法
本专利技术涉及,具体涉及利用缺失多标签数据实现多标签模型训练框架的实现方法。
技术介绍
在监督学习的框架下,使用深度学习模型完成分类识别任务,需要每一份训练数据都具有标签(属性)。与此同时,当需要单个模型能够对多个标签(属性)进行同时预测时候,通常情况下需要保证每一个训练样本的每一个标签(属性)都是完整的。然而,获取具有多标签(属性)标注的数据需要耗费大量的人力;且通常情况下,更大规模的网络结构意味着更好的泛化能力。但如果数据集的大小不能与模型的规模相匹配,则网络会造成严重的过拟合情况,导致其泛化能力急剧下降。当训练多个单一属性模型的时候,由于各个数据集之间的规模可能不同,如果使用单一相同网络结构进行训练,则可能出现过拟合和欠拟合的情况。
技术实现思路
为了解决上述现有技术存在的技术问题,本专利技术提供了利用缺失多标签数据实现多标签模型训练框架的实现方法,本专利技术考虑到需要同时预测的一系列标签(属性)具有相关性,其在深度网络中对应的特征具有相似性,因此我们提出了一种整合多本文档来自技高网...

【技术保护点】
1.利用缺失多标签数据实现多标签模型训练框架的实现方法,其特征在于,包括以下步骤:/n步骤一、整合多个单一标签数据集,生成不完整多标签数据集;/n步骤二、从不完整多标签数据集中随机选取样本数据,将样本数据输入到共享分支网络中进行特征提取,获得共享分支的特征输出;/n步骤三、将共享分支的特征输出分别输入到对应的非共享分支网络,在每一个非共享分支处得到对应任务的输出预测值集合;/n步骤四、逐一利用每一个非共享分支处的输出预测值集合完成非共享分支网络的权重更新,在所有非共享分支网络完成更新之后,继续完成共享分支的权重更新,实现利用缺失多标签数据完成多标签模型的训练。/n

【技术特征摘要】
1.利用缺失多标签数据实现多标签模型训练框架的实现方法,其特征在于,包括以下步骤:
步骤一、整合多个单一标签数据集,生成不完整多标签数据集;
步骤二、从不完整多标签数据集中随机选取样本数据,将样本数据输入到共享分支网络中进行特征提取,获得共享分支的特征输出;
步骤三、将共享分支的特征输出分别输入到对应的非共享分支网络,在每一个非共享分支处得到对应任务的输出预测值集合;
步骤四、逐一利用每一个非共享分支处的输出预测值集合完成非共享分支网络的权重更新,在所有非共享分支网络完成更新之后,继续完成共享分支的权重更新,实现利用缺失多标签数据完成多标签模型的训练。


2.根据权利要求1所述的利用缺失多标签数据实现多标签模型训练框架的实现方法,其特征在于,所述步骤一具体包括:
步骤1.1获取多个单一标签数据集并进行整合;
步骤1.2对多个单一标签数据集进行整合时,将合并后的数据集中来自某一标签数据集的样本的其他标签设置为-1,代表缺失标签值;
步骤1.3整合后,生成不完整多标签数据集,不完整多标签数据集中每一个样本为B=(xdata,label1,label2,…,labeln),其中,xdat...

【专利技术属性】
技术研发人员:肖利喻杨洋王飞
申请(专利权)人:成都睿码科技有限责任公司杭州数峰科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1