多标签识别方法、训练方法及装置制造方法及图纸

技术编号:23099306 阅读:12 留言:0更新日期:2020-01-14 20:38
本申请提供一种多标签识别方法、训练方法及装置,涉及机器学习技术领域。该方法包括:对待识别内容进行特征提取,得到待识别内容的特征向量;使用多个分类模型分别对所述待识别内容的特征向量进行分类,获得各所述分类模型输出的各标签的分类概率,每个分类模型对应一个标签;所述标签的分类概率用于指示所述待识别内容的特征向量分类为所述标签的概率;根据标签依赖矩阵及各所述标签的分类概率,确定所述待识别内容的标签序列,其中,所述标签依赖矩阵包含各标签之间具有依赖关系的权重。本申请可提高标签识别准确度。

Multi label recognition method, training method and device

【技术实现步骤摘要】
多标签识别方法、训练方法及装置
本专利技术涉及机器学习
,具体而言,涉及一种多标签识别方法、训练方法及装置。
技术介绍
随着互联网技术的发展,网络上的内容越来越多,为便于进行内容的推荐,网络上的内容大多具有各自的内容标签,以指示该内容所包括的信息类型等。目前,网络上的内容标签可以为用户输入的标签,也可以为通过对内容进行识别,继而得到的标签。对于机器识别得到的标签,通常可通过多类标签的二分类模型,分别识别多类标签中的每类标签是否为待识别的内容的标签,继而得到该内容的标签。然而,上述方法识别得到的内容的标签,无法真实反应内容所包含的信息,其标签识别的准确度较低。
技术实现思路
本专利技术的目的在于,针对上述现有技术中的不足,提供一种多标签识别方法、训练方法及装置,以解决标签识别的准确度较低的问题。为实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本专利技术实施例提供了一种多标签识别方法,所述方法包括:使用多个分类模型分别对所述待识别内容的特征向量进行分类,获得各所述分类模型输出的各标签的分类概率,每个分类模型对应一类标签;所述标签的分类概率用于指示所述待识别内容的特征向量分类为所述标签的概率;根据标签依赖矩阵及各所述标签的分类概率,确定所述待识别内容的标签序列,其中,所述标签依赖矩阵包含各标签之间具有依赖关系的权重。在一种实现方式中,所述根据标签依赖矩阵及各所述标签的分类概率,确定所述待识别内容的标签序列,包括:根据多类标签构成的每个标签序列中各标签的分类概率,以及所述标签依赖矩阵中所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的得分参数;根据所述多类标签构成的多个标签序列的得分参数,从所述多个标签序列中,确定最高得分参数的标签序列为所述待识别内容的标签序列;其中,所述标签依赖矩阵中各标签之间具有依赖关系的权重包括:每类标签与其他类标签之间具有依赖关系的权重。该方法中,可根据该多个标签序列的得分参数,从该多个标签序列中,确定最高得分参数的标签序列为该待识别内容的标签序列,可使得得到的标签序列与该待识别内容更匹配,该标签序列中标签之间的依赖程度更高,使得内容的标签识别更准确。在另一种实现方式中,所述根据多类标签构成的每个标签序列中各标签的分类概率,以及所述标签依赖矩阵中所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的得分参数,包括:根据所述每个标签序列中各标签的分类概率,确定所述每个标签序列的概率得分;根据所述标签依赖矩阵中各标签之间具有依赖关系的权重,确定所述每个标签序列的关系得分;根据所述每个标签序列的概率得分,和所述每个标签序列的关系得分,确定所述每个标签序列的得分参数。该方法,可分别确定每个标签序列的概率得分和关系得分,继而根据该概率得分和该关系得分,确定该每个标签序列的得分参数,可使得标签序列的得分参数更准确,从而使得识别得到的待识别内容的标签序列更准确,有效提高了标识识别的准确度。在再一种实现方式中,所述对待识别内容进行特征提取,得到所述待识别内容的特征向量,包括:采用深度学习模型,对所述待识别内容进行特征提取,得到所述待识别内容的特征向量;其中,若所述待识别内容为图像内容,则所述深度学习模型为卷积神经网络CNN模型;或者,若所述待识别内容为文本内容,则所述深度学习模型为循环神经网络CNN模型。第二方面,本专利技术实施例还提供一种多标签识别网络模型的训练方法,包括:对样本内容进行特征提取,得到所述样本内容的特征向量;使用多个分类模型分别对所述样本内容的特征向量进行分类,获得各所述分类模型输出的各标签的分类概率,每个分类模型对应一类标签;所述标签的分类概率用于指示所述样本内容的特征向量分类为所述标签的概率;根据标签依赖矩阵及各所述标签的分类概率,确定所述样本内容的预测标签序列,其中,所述标签依赖矩阵包含各标签之间具有依赖关系的权重;根据所述样本内容的预测标签序列,以及所述样本内容的真实标签序列,对所述标签依赖矩阵中各权重进行更新。在一种可能的实现方式中,所述根据所述样本内容的预测标签序列,以及所述样本内容的真实标签序列,对所述标签依赖矩阵中各权重进行更新,包括:根据多类标签构成的每个标签序列中各标签的分类概率,以及所述标签依赖矩阵中所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的训练得分参数;根据所述多个标签序列中所述真实标签序列的训练得分参数,以及所述预测标签序列的训练得分参数,确定所述多标签识别网络模型的损失函数值;其中,所述预测标签序列为所述多个标签序列中训练得分参数最高的标签序列;根据所述损失函数值,对所述标签依赖矩阵的各权重进行更新。在另一种实现方式中,所述根据所述损失函数值,对所述标签依赖矩阵的各权重进行更新,包括:根据所述损失函数值,采用梯度下降算法,对所述标签依赖矩阵的各权重进行更新,直至,基于更新之后的权重所得到的损失函数值最小。在又一种实现方式中,所述方法还包括:根据所述预测标签序列与所述真实标签序列中相同的标签数,以及所述预测标签序列的标签数,确定所述多标签识别网络模型的精准率;和/或,根据所述相同的标签数,以及所述真实标签序列的标签数,确定所述多标签识别网络模型的召回率第三方面,本专利技术实施例还提供一种多标签识别装置,所述装置包括:提取模块,用于采用所述特征提取层,对待识别内容进行特征提取,得到所述待识别内容的特征向量;分类模块,用于使用多个分类模型分别对所述待识别内容的特征向量进行分类,获得各所述分类模型输出的各标签的分类概率,每个分类模型对应一类标签;所述标签的分类概率用于指示所述待识别内容的特征向量分类为所述标签的概率;确定模块,用于根据标签依赖矩阵及各所述标签的分类概率,确定所述待识别内容的标签序列,其中,所述标签依赖矩阵包含各标签之间具有依赖关系的权重。在一种实现方式中,所述确定模块,具体用于根据多类标签构成的每个标签序列中各标签的分类概率,以及所述标签依赖矩阵中所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的得分参数;根据所述多类标签构成的多个标签序列的得分参数,从所述多个标签序列中,确定最高得分参数的标签序列为所述待识别内容的标签序列;其中,所述标签依赖矩阵中各标签之间具有依赖关系的权重包括:每类标签与其他类标签之间具有依赖关系的权重。在另一种实现方式中,所述确定模块,具体用于根据所述每个标签序列中各标签的分类概率,确定所述每个标签序列的概率得分;根据所述标签依赖矩阵中各标签之间具有依赖关系的权重,确定所述每个标签序列的关系得分;根据所述每个标签序列的概率得分,和所述每个标签序列的关系得分,确定所述每个标签序列的得分参数。在再一种实现方式中,所述提取模块,具体用于采用本文档来自技高网...

【技术保护点】
1.一种多标签识别方法,其特征在于,所述方法包括:/n对待识别内容进行特征提取,得到所述待识别内容的特征向量;/n使用多个分类模型分别对所述待识别内容的特征向量进行分类,获得各所述分类模型输出的各标签的分类概率,每个分类模型对应一类标签;所述标签的分类概率用于指示所述待识别内容的特征向量分类为所述标签的概率;/n根据标签依赖矩阵及各所述标签的分类概率,确定所述待识别内容的标签序列,其中,所述标签依赖矩阵包含各标签之间具有依赖关系的权重。/n

【技术特征摘要】
1.一种多标签识别方法,其特征在于,所述方法包括:
对待识别内容进行特征提取,得到所述待识别内容的特征向量;
使用多个分类模型分别对所述待识别内容的特征向量进行分类,获得各所述分类模型输出的各标签的分类概率,每个分类模型对应一类标签;所述标签的分类概率用于指示所述待识别内容的特征向量分类为所述标签的概率;
根据标签依赖矩阵及各所述标签的分类概率,确定所述待识别内容的标签序列,其中,所述标签依赖矩阵包含各标签之间具有依赖关系的权重。


2.根据权利要求1所述的方法,其特征在于,所述根据标签依赖矩阵及各所述标签的分类概率,确定所述待识别内容的标签序列,包括:
根据多类标签构成的每个标签序列中各标签的分类概率,以及所述标签依赖矩阵中所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的得分参数;
根据所述多类标签构成的多个标签序列的得分参数,从所述多个标签序列中,确定最高得分参数的标签序列为所述待识别内容的标签序列;
其中,所述标签依赖矩阵中各标签之间具有依赖关系的权重包括:每类标签与其他类标签之间具有依赖关系的权重。


3.根据权利要求2所述的方法,其特征在于,所述根据多类标签构成的每个标签序列中各标签的分类概率,以及所述标签依赖矩阵中所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的得分参数,包括:
根据所述每个标签序列中各标签的分类概率,确定所述每个标签序列的概率得分;
根据所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的关系得分;
根据所述每个标签序列的概率得分,和所述每个标签序列的关系得分,确定所述每个标签序列的得分参数。


4.根据权利要求1-3中任一所述的方法,其特征在于,所述对待识别内容进行特征提取,得到所述待识别内容的特征向量,包括:
采用深度学习模型,对所述待识别内容进行特征提取,得到所述待识别内容的特征向量;
其中,若所述待识别内容为图像内容,则所述深度学习模型为卷积神经网络CNN模型;或者,
若所述待识别内容为文本内容,则所述深度学习模型为循环神经网络CNN模型。


5.一种多标签识别网络模型的训练方法,其特征在于,包括:
对样本内容进行特征提取,得到所述样本内容的特征向量;
使用多个分类模型分别对所述样本内容的特征向量进行分类,获得各所述分类模型输出的各标签的分类概率,每个分类模型对应一类标签;所述标签的分类概率用于指示所述样本内容的特征向量分类为所述标签的概率;
根据标签依赖矩阵及各所述标签的分类概率,确定所述样本内容的预测标签序列,其中,所述标签依赖矩阵包含各标签之间具有依赖关系的权重;
根据所述样本内容的预测标签序列,以及所述样本内容的真实标签序列,对所述标签依赖矩阵中各权重进行更新。


6.根据权利要求5所述的方法,其特征在于,所述根据所述样本内容的预测标签序列,以及所述样本内容的真实标签序列,对所述标签依赖矩阵中各权重进行更新,包括:
根据多类标签构成的每个标签序列中各标签的分类概率,以及所述标签依赖矩阵中所述每个标签序列中各标签之间具有依赖关系的权重,确定所述每个标签序列的训练得分参数;
根据所述多类标签构成的多个标签序列中所述真实标签序列的训练得分参数,以及所述预测标签序列的训练得分参数,确定所述多标签识别网络模型的损失函数值;其中,所述预测标签序列为所述多个标签序列中训练得分参数最高的标签序列;
根据所述损失函数值,对所述标签依赖矩阵的各权重进行更新。


7.根据权利要求6所述的方法,其特征在于,所述根据所述损失函数值,对所述标签依赖矩阵的各权重进行更新,包括:
根据所述损失函数值,采用梯度下降算法,对所述标签依赖矩阵的各权重进行更新,直至,基于更新之后的权重所得到的损失函数值最小。


8.根据权利要求5-7中任一所述的方法,其特征在于,所述方法还包括:
根据所述预测标签序列与所述真实标签序列中相同的标签数,以及所述预测标签序列的标签数,确定所述多标签识别网络模...

【专利技术属性】
技术研发人员:王李鹏
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1