多标签分类模型训练方法和设备技术

技术编号:21362324 阅读:26 留言:0更新日期:2019-06-15 09:31
本发明专利技术提供一种多标签分类模型训练方法,包括:利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;根据所述第一损失值和所述第二损失值确定第三损失值;向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。

Multi-label Classification Model Training Method and Equipment

The invention provides a multi-label classification model training method, which includes: classifying samples using multi-label classification model to obtain output vectors, which are used to represent various specific categories, the samples have first label and second label, the first label is used to represent various specific categories of the samples, and the second label is used to represent each of the samples. A merging category is defined according to the specific category described in the section; the merging vectors are processed to obtain merging vectors, which are used to represent at least one merging category; the first loss value is determined according to the output vector and the first tag; and the second loss value is determined according to the merging vector and the second tag; The first loss value and the second loss value determine the third loss value, and feedback the third loss value to the multi-label classification model to adjust its parameters.

【技术实现步骤摘要】
多标签分类模型训练方法和设备
本专利技术涉及人工智能领域,具体涉及一种多标签分类模型训练方法和设备。
技术介绍
利用机器学习算法和模型对目标进行识别是一种高效的智能识别方式,也是诸如自动驾驶、智能摄像、机器人等众多领域的底层技术。多标签,即MultiLabel,指的是一个样本可能同时属于多个类,即有多个标签。比如一件L尺寸的棉服,则该样本就有至少两个标签——型号:L,类型:冬装。利用多标签样本对机器学习模型进行训练可以得到多标签分类模型,这种模型可以对一个目标进行识别,输出的识别结果可以是一个向量,用于表达该目标所属的类别。在很多现实应用场景中,被识别的目标本身具有多种具体的类别,而这些具体类别中又有一部分同属于一个大类。例如对于眼底图像而言,其本身可以属于糖网轻度、糖网中度、糖网重度、糖网增殖期、静脉阻塞、动脉阻塞、青光眼、豹纹样病变这8种具体类别,而其中糖网轻度、糖网中度、糖网重度、糖网增殖期这4种具体类别都属于糖网疾病这一个大类。利用多标签分类模型对这种眼底图像进行识别时,如果模型输出的结果表示该图像属于糖网轻度,但实际上该图像属于糖网重度,这种错误的分类结果是可以被接收的结果;但若模型输出的结果表示该图像属于青光眼,则这种错误不可被接受。在现有的多标签分类模型训练方案中,当模型对样本的识别结果与标签不一致时,将根据二者的差别确定一个损失值,然后模型会根据该损失值调整自身的参数以提高性能。但是这种训练方案没有考虑到可接受的错误与不可接受的错误的差别,根据对所有具体类别的识别结果调整参数,会使模型输出类别缩小,由此降低了模型的性能。
技术实现思路
有鉴于此,本专利技术提供一种多标签分类模型训练方法,包括:利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;根据所述第一损失值和所述第二损失值确定第三损失值;向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。可选地,所述输出向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别的置信度。可选地,对所述输出向量进行处理得到合并向量,包括:在所述多个数值中提取设定的部分数值合并为一个数值;利用合并后的数值和未被提取的数值形成所述合并向量。可选地,所述第一标签为第一目标向量,所述第一目标向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别;所述第二标签为第二目标向量,所述第二目标向量中包括至少一个利用所述第一目标向量中的部分数值得到的合并数值,其中每一个合并数值分别用于表示所述样本属于一种合并类别。可选地,根据所述第一损失值和所述第二损失值确定第三损失值,包括:对所述第二损失值进行非线性变换处理;将非线性变换后的第二损失值和所述第一损失值相加得到所述第三损失值。可选地,所述方法用于训练医学图像多分类模型。可选地,所述方法用于训练眼底图像多分类模型。可选地,所述具体类别为眼底疾病类别,所述合并类别为至少部分所述眼底疾病类别同属的疾病大类。可选地,所述具体类别至少包括多种糖尿病视网膜病变,所述合并类别用于表示所述多种糖尿病视网膜病变的合并类别。相应地,本专利技术提供一种多标签分类模型训练设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述多标签分类模型训练方法。根据本专利技术实施例提供的多标签分类模型训练方法和设备,使用具有两个标签的样本作为训练数据,其中一个标签表示样本所属的具体类别,另一个标签表示样本所属的合并类别,一个合并类别对应于多个具体类别,在计算模型损失时,在计算具体类别损失的基础上融合了对应于合并类别的损失,当模型训练的过程中对合并类别识别出现错误时,通过这种损失值计算方式加入更大的惩罚,本方案对模型出现的可接受错误和不可接受错误区别对待,由此可以提高多分类模型的性能。将本专利技术提供的方案应用于训练医学图像多分类模型,特别是对于眼底图像多分类模型,可以提高模型对各种具体疾病类别的召回率和精确性,并可以抑制假阳性。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中的一种多标签分类模型训练方法的流程图;图2为本专利技术实施例中的眼底图像多标签分类模型训练方法的流程图;图3为本专利技术实施例中的多标签分类模型训练装置的结构示意图。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。此外,下面所描述的本专利技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。在一个实施例中,提供一种用于识别文字数据的多标签分类模型,用于训练该模型的样本为文字样本。文字样本具有两个标签,第一标签用于表示该文字样本所属的各种具体类别,第二标签用于表示文字样本所属的各种合并类别,合并类别是根据部分具体类别确定的。在另一个实施例中,提供一种用于识别声音数据的多标签分类模型,用于训练该模型的样本为声音样本。声音样本具有两个标签,第一标签用于表示该声音样本所属的各种具体类别,第二标签用于表示声音样本所属的各种合并类别,合并类别是根据部分具体类别确定的。在第三个实施例中,提供一种用于识别图像数据的多标签分类模型,用于训练该模型的样本为图像样本。图像样本具有两个标签,第一标签用于表示该图像样本所属的各种具体类别,第二标签用于表示图像样本所属的各种合并类别,合并类别是根据部分具体类别确定的。样本的具体类别和合并类别需要提前被标注,假设一个样本同时可能属于1……i……n这n种具体类别,而类别1……i属于第一种大类,则第一种大类是根据1……i这i种具体类别确定的。对于本专利技术提供的方案而言,具体类别必须有多种,而合并类别可以只有一种也可以有多种,不同的合并类别分别根据不同的具体类别而定。本专利技术提供一种多标签分类模型训练方法,可以用于训练上述各种多标签分类模型,该方法可以由计算机和服务器等电子设备执行。本方法中的多标签分类模型可以是多种类型和结构的神经网络。如图1所示该方法包括如下步骤:S1A,利用多标签分类模型对样本进行分类得到输出向量,输出向量用于表示各种具体类别。作为一个具体举例,医学图像通常可以反应出多种疾病,多标签分类模型可以针对样本医学图像输出一个向量[x1,……,xi,xj,……,xn],其中x1是用于表示该图像属于第1种疾病的数值……x本文档来自技高网...

【技术保护点】
1.一种多标签分类模型训练方法,其特征在于,包括:利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;根据所述第一损失值和所述第二损失值确定第三损失值;向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。

【技术特征摘要】
1.一种多标签分类模型训练方法,其特征在于,包括:利用多标签分类模型对样本进行分类得到输出向量,所述输出向量用于表示各种具体类别,所述样本具有第一标签和第二标签,所述第一标签用于表示所述样本的各种具体类别,所述第二标签用于表示所述样本的各种合并类别,其中所述合并类别是根据部分所述具体类别确定的;对所述输出向量进行处理得到合并向量,所述合并向量用于表示至少一种合并类别;根据所述输出向量和所述第一标签确定第一损失值,以及根据所述合并向量和所述第二标签确定第二损失值;根据所述第一损失值和所述第二损失值确定第三损失值;向所述多标签分类模型反馈所述第三损失值以使其调整自身参数。2.根据权利要求1所述的方法,其特征在于,所述输出向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别的置信度。3.根据权利要求2所述的方法,其特征在于,对所述输出向量进行处理得到合并向量,包括:在所述多个数值中提取设定的部分数值合并为一个数值;利用合并后的数值和未被提取的数值形成所述合并向量。4.根据权利要求2所述的方法,其特征在于,所述第一标签为第一目标向量,所述第一目标向量中包括多个数值,每一个数值分别用于表示所述样本属于一种具体类别;所述第二标签为第二...

【专利技术属性】
技术研发人员:马永培熊健皓赵昕和超张大磊
申请(专利权)人:上海鹰瞳医疗科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1