The invention provides a multi-label classification model training method, which includes: classifying samples using multi-label classification model to obtain output vectors, which are used to represent various specific categories, the samples have first label and second label, the first label is used to represent various specific categories of the samples, and the second label is used to represent each of the samples. A merging category is defined according to the specific category described in the section; the merging vectors are processed to obtain merging vectors, which are used to represent at least one merging category; the first loss value is determined according to the output vector and the first tag; and the second loss value is determined according to the merging vector and the second tag; The first loss value and the second loss value determine the third loss value, and feedback the third loss value to the multi-label classification model to adjust its parameters.
【技术实现步骤摘要】
多标签分类模型训练方法和设备
本专利技术涉及人工智能领域,具体涉及一种多标签分类模型训练方法和设备。
技术介绍
利用机器学习算法和模型对目标进行识别是一种高效的智能识别方式,也是诸如自动驾驶、智能摄像、机器人等众多领域的底层技术。多标签,即MultiLabel,指的是一个样本可能同时属于多个类,即有多个标签。比如一件L尺寸的棉服,则该样本就有至少两个标签——型号:L,类型:冬装。利用多标签样本对机器学习模型进行训练可以得到多标签分类模型,这种模型可以对一个目标进行识别,输出的识别结果可以是一个向量,用于表达该目标所属的类别。在很多现实应用场景中,被识别的目标本身具有多种具体的类别,而这些具体类别中又有一部分同属于一个大类。例如对于眼底图像而言,其本身可以属于糖网轻度、糖网中度、糖网重度、糖网增殖期、静脉阻塞、动脉阻塞、青光眼、豹纹样病变这8种具体类别,而其中糖网轻度、糖网中度、糖网重度、糖网增殖期这4种具体类别都属于糖网疾病这一个大类。利用多标签分类模型对这种眼底图像进行识别时,如果模型输出的结果表示该图像属于糖网轻度,但实际上该图像属于糖网重度,这种错误的分类结果是可以被接收的结果;但若模型输出的结果表示该图像属于青光眼,则这种错误不可被接受。在现有的多标签分类模型训练方案中,当模型对样本的识别结果与标签不一致时,将根据二者的差别确定一个损失值,然后模型会根据该损失值调整自身的参数以提高性能。但是这种训练方案没有考虑到可接受的错误与不可接受的错误的差别,根据对所有具体类别的识别结果调整参数,会使模型输出类别缩小,由此降低了模型的性能。
技术实现思路
有鉴于此 ...
【技术保护点】
1.一种多标签分类模型训练方法,其特征在于,包括:利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;根据所述第一损失值和所述第二损失值确定第三损失值;向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。
【技术特征摘要】
1.一种多标签分类模型训练方法,其特征在于,包括:利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;根据所述第一损失值和所述第二损失值确定第三损失值;向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。2.根据权利要求1所述的方法,其特征在于,所述输出向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别的置信度。3.根据权利要求2所述的方法,其特征在于,对所述输出向量进行处理得到合并向量,包括:在所述多个数值中提取设定的部分数值合并为一个数值;利用合并后的数值和未被提取的数值形成所述合并向量。4.根据权利要求2所述的方法,其特征在于,所述第一标签为第一目标向量,所述第一目标向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别;所述第二标签为第二...
【专利技术属性】
技术研发人员:马永培,熊健皓,赵昕,和超,张大磊,
申请(专利权)人:上海鹰瞳医疗科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。