提供标签的方法、装置、设备及可读存储介质制造方法及图纸

技术编号:21225368 阅读:18 留言:0更新日期:2019-05-29 06:06
本申请公开了一种提供标签的方法、装置、设备及可读存储介质,属于深度学习技术领域。方法包括:基于深度学习模型预测目标内容的第一标签;根据第一标签获取与第一标签具有相关性的第二标签;将第一标签和第二标签作为目标内容的标签提供给标注系统进行标注。通过深度学习模型预测目标内容的第一标签,由于该第一标签比默认标签的标注精度要高,从而可以提高提供给标注系统的标签的准确率。此外,将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统,进一步提高了标注数据的可用比例,从而节省标注资源。

Methods, devices, devices and readable storage media for providing Tags

This application discloses a method, device, device and readable storage medium for providing tags, belonging to the field of deep learning technology. The methods include: predicting the first tag of the target content based on the in-depth learning model; obtaining the second tag related to the first tag according to the first tag; and providing the first tag and the second tag as the tag of the target content to the tagging system for tagging. The first tag of the target content is predicted by the in-depth learning model. Because the first tag is more accurate than the default tag, the accuracy of the tag provided to the tagging system can be improved. In addition, the label of the first label and the second label which is related to the first label are provided to the labeling system as the target content, which further improves the usability ratio of labeling data and consequently saves labeling resources.

【技术实现步骤摘要】
提供标签的方法、装置、设备及可读存储介质
本公开涉及深度学习
,尤其涉及一种提供标签的方法、装置、设备及可读存储介质。
技术介绍
近年来,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用,在应用深度学习的过程中,需要为目标内容设置标签,将目标内容的标签提供给标注系统,以对该目标内容进行标注得到标注数据,从而基于大量的标注数据生成深度学习模型。以目标内容为图像为例,相关技术在提供标签时,出于页面篇幅以及标注人员可操作性的考虑,一般系统会随机的给图像提供一个默认的标签,将该默认的标签提供给标注系统,由标注人员对该图像的默认标签进行标注。然而,由于相关技术仅采用默认的标签来进行标注,该默认的标签有时候不太准确,导致标注系统中标注数据的可用率低。
技术实现思路
本公开提供一种提供标签的方法、装置、设备及可读存储介质,以克服相关技术中存在的问题。根据本公开实施例的第一方面,提供一种提供标签的方法,包括:基于深度学习模型预测目标内容的第一标签;根据所述第一标签获取与所述第一标签具有相关性的第二标签;将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。可选地,所述根据所述第一标签获取与所述第一标签具有相关性的第二标签,包括:根据所述第一标签获取与所述第一标签具有相关性的语义标签;根据所述第一标签获取与所述第一标签具有相关性的混淆标签;将所述语义标签和/或混淆标签作为与所述第一标签具有相关性的第二标签。可选地,所述根据所述第一标签获取与所述第一标签具有相关性的语义标签,包括:获取词向量模型,根据所述词向量模型获取所述第一标签的标签词向量;获取词库,计算所述标签词向量与所述词库中每一个词的词向量之间的距离,将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签。可选地,所述根据所述第一标签获取与所述第一标签具有相关性的混淆标签,包括:根据用于获取所述深度学习模型的数据集构建混淆矩阵;根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签。可选地,所述用于获取所述深度学习模型的数据集包括训练集,所述训练集中的每个样本具有参考标签,所述根据用于获取所述深度学习模型的数据集构建混淆矩阵,包括:将所述第一标签与所述训练集中的参考标签进行统计,得到混淆矩阵,所述混淆矩阵中每个元素的值为所述第一标签与对应的参考标签之间的混淆值。可选地,所述根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签,包括:根据所述混淆矩阵中所述第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与所述第一标签具有相关性的混淆标签。根据本公开实施例的第二方面,提供一种提供标签的装置,包括:预测模块,被配置为基于深度学习模型预测目标内容的第一标签;获取模块,被配置为根据所述第一标签获取与所述第一标签具有相关性的第二标签;提供模块,被配置为将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。可选地,所述获取模块包括第一获取单元、第二获取单元和设置单元;所述第一获取单元,被配置为根据所述第一标签获取与所述第一标签具有相关性的语义标签;所述第二获取单元,被配置为根据所述第一标签获取与所述第一标签具有相关性的混淆标签;所述设置单元,被配置为将所述语义标签和/或混淆标签作为与所述第一标签具有相关性的第二标签。可选地,所述第一获取单元,被配置为获取词向量模型,根据所述词向量模型获取所述第一标签的标签词向量;获取词库,计算所述标签词向量与所述词库中每一个词的词向量之间的距离,将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签。可选地,所述第二获取单元包括构建子单元和第二获取子单元;所述构建子单元,被配置为基于获取的所述深度学习模型的数据集构建混淆矩阵;所述第二获取子单元,被配置为根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签。可选地,所述用于获取所述深度学习模型的数据集包括训练集,所述训练集中的每个样本具有参考标签;所述构建子单元,被配置为将所述第一标签与所述训练集中的参考标签进行统计,得到混淆矩阵,所述混淆矩阵中每个元素的值为所述第一标签与对应的参考标签之间的混淆值。可选地,所述第二获取子单元,被配置为根据所述混淆矩阵中所述第一标签与各个参考标签之间的混淆值,将混淆值满足混淆阈值的参考标签作为与所述第一标签具有相关性的混淆标签。根据本申请实施例的第三方面,提供一种提供标签的设备,所述设备包括处理器和存储器;所述存储器,被配置为存储处理器可执行的至少一条指令;所述处理器被配置为执行所述指令以实现如上所述的任一种提供标签的方法。根据本申请实施例的第四方面,提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器执行以实现如上所述的任一种提供标签的方法。根据本申请实施例的第五方面,提供一种计算机程序产品,包括一条或多条指令,该一条或多条指令可以由电子设备的处理器执行时,使得电子设备能够执行一种以实现如上述第一方面中任一项提供标签的方法所执行的操作。本申请的实施例提供的技术方案带来的有益效果至少包括:通过深度学习模型预测目标内容的第一标签,由于该第一标签比默认标签的标注精度要高,从而可以提高提供给标注系统的标签的准确率。此外,将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统,进一步提高了标注数据的可用比例,从而节省标注资源。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。图1是本申请实施例提供的实施环境示意图;图2是本申请实施例提供的一种提供标签的方法流程图;图3是本申请实施例提供的一种获取第二标签的方法流程图;图4是本申请实施例提供的一种提供标签的装置的框图;图5是本申请实施例提供的一种获取模块的结构示意图;图6是本申请实施例提供的一种提供标签的设备的结构示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。本申请实施例提供了一种提供标签的方法,该方法可应用于如图1所示的实施环境中。图1中,包括至少一个提供标签的设备11和服务器12,提供标签的设备11可与服务器12进行通信连接,以从服务器12上下载内容。或者,提供标签的设备11为需要进行标注的目标内容提供标签后,将需要标注的目标内容及标签发送给服务器12进行标注。其中,提供标签的设备11可以是任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品。例如,提供标签的设备11可以是手机、智能手机、PDA(PersonalDigitalAssistant,个人数字助手)、PC(PersonalComputer,个人计算机)、可穿戴设备、PPC(PocketPC,掌上电脑)、平板电脑、智能车机、智能电视、智能音箱等。服务器12可以是一台服务器,也本文档来自技高网...

【技术保护点】
1.一种提供标签的方法,其特征在于,所述方法包括:基于深度学习模型预测目标内容的第一标签;根据所述第一标签获取与所述第一标签具有相关性的第二标签;将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。

【技术特征摘要】
1.一种提供标签的方法,其特征在于,所述方法包括:基于深度学习模型预测目标内容的第一标签;根据所述第一标签获取与所述第一标签具有相关性的第二标签;将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一标签获取与所述第一标签具有相关性的第二标签,包括:根据所述第一标签获取与所述第一标签具有相关性的语义标签;根据所述第一标签获取与所述第一标签具有相关性的混淆标签;将所述语义标签和/或混淆标签作为与所述第一标签具有相关性的第二标签。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一标签获取与所述第一标签具有相关性的语义标签,包括:获取词向量模型,根据所述词向量模型获取所述第一标签的标签词向量;获取词库,计算所述标签词向量与所述词库中每一个词的词向量之间的距离,将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签。4.根据权利要求2所述的方法,其特征在于,所述根据所述第一标签获取与所述第一标签具有相关性的混淆标签,包括:根据用于获取所述深度学习模型的数据集构建混淆矩阵;根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签。5.根据权利要求4所述的方法,其特征在于,所述用于获取所述深度学习模型的数据集包括训练集,所述训练集中的每个样本具有参考标签,所述根据用于获取所述深度学习模型的数据集构建混淆矩阵,包括:将所述第一标签与所述训练集中的参考标签进行统计,得...

【专利技术属性】
技术研发人员:张志伟夏雨赵伟阳
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1