提供标签的方法、装置、设备及可读存储介质制造方法及图纸

技术编号：21225368 阅读：18 留言：0更新日期：2019-05-29 06:06

本申请公开了一种提供标签的方法、装置、设备及可读存储介质，属于深度学习技术领域。方法包括：基于深度学习模型预测目标内容的第一标签；根据第一标签获取与第一标签具有相关性的第二标签；将第一标签和第二标签作为目标内容的标签提供给标注系统进行标注。通过深度学习模型预测目标内容的第一标签，由于该第一标签比默认标签的标注精度要高，从而可以提高提供给标注系统的标签的准确率。此外，将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统，进一步提高了标注数据的可用比例，从而节省标注资源。

Methods, devices, devices and readable storage media for providing Tags

This application discloses a method, device, device and readable storage medium for providing tags, belonging to the field of deep learning technology. The methods include: predicting the first tag of the target content based on the in-depth learning model; obtaining the second tag related to the first tag according to the first tag; and providing the first tag and the second tag as the tag of the target content to the tagging system for tagging. The first tag of the target content is predicted by the in-depth learning model. Because the first tag is more accurate than the default tag, the accuracy of the tag provided to the tagging system can be improved. In addition, the label of the first label and the second label which is related to the first label are provided to the labeling system as the target content, which further improves the usability ratio of labeling data and consequently saves labeling resources.

全部详细技术资料下载

【技术实现步骤摘要】
提供标签的方法、装置、设备及可读存储介质
本公开涉及深度学习
，尤其涉及一种提供标签的方法、装置、设备及可读存储介质。
技术介绍
近年来，深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用，在应用深度学习的过程中，需要为目标内容设置标签，将目标内容的标签提供给标注系统，以对该目标内容进行标注得到标注数据，从而基于大量的标注数据生成深度学习模型。以目标内容为图像为例，相关技术在提供标签时，出于页面篇幅以及标注人员可操作性的考虑，一般系统会随机的给图像提供一个默认的标签，将该默认的标签提供给标注系统，由标注人员对该图像的默认标签进行标注。然而，由于相关技术仅采用默认的标签来进行标注，该默认的标签有时候不太准确，导致标注系统中标注数据的可用率低。
技术实现思路
本公开提供一种提供标签的方法、装置、设备及可读存储介质，以克服相关技术中存在的问题。根据本公开实施例的第一方面，提供一种提供标签的方法，包括：基于深度学习模型预测目标内容的第一标签；根据所述第一标签获取与所述第一标签具有相关性的第二标签；将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。可选地，所述根据所述第一标签获取与所述第一标签具有相关性的第二标签，包括：根据所述第一标签获取与所述第一标签具有相关性的语义标签；根据所述第一标签获取与所述第一标签具有相关性的混淆标签；将所述语义标签和/或混淆标签作为与所述第一标签具有相关性的第二标签。可选地，所述根据所述第一标签获取与所述第一标签具有相关性的语义标签，包括：获取词向量模型，根据所述词向量模型获取所述第一标签的标签...

【技术保护点】
1.一种提供标签的方法，其特征在于，所述方法包括：基于深度学习模型预测目标内容的第一标签；根据所述第一标签获取与所述第一标签具有相关性的第二标签；将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。

【技术特征摘要】
1.一种提供标签的方法，其特征在于，所述方法包括：基于深度学习模型预测目标内容的第一标签；根据所述第一标签获取与所述第一标签具有相关性的第二标签；将所述第一标签和所述第二标签作为所述目标内容的标签提供给标注系统进行标注。2.根据权利要求1所述的方法，其特征在于，所述根据所述第一标签获取与所述第一标签具有相关性的第二标签，包括：根据所述第一标签获取与所述第一标签具有相关性的语义标签；根据所述第一标签获取与所述第一标签具有相关性的混淆标签；将所述语义标签和/或混淆标签作为与所述第一标签具有相关性的第二标签。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一标签获取与所述第一标签具有相关性的语义标签，包括：获取词向量模型，根据所述词向量模型获取所述第一标签的标签词向量；获取词库，计算所述标签词向量与所述词库中每一个词的词向量之间的距离，将所述词库中与所述标签词向量的距离满足条件的词作为与所述第一标签具有相关性的语义标签。4.根据权利要求2所述的方法，其特征在于，所述根据所述第一标签获取与所述第一标签具有相关性的混淆标签，包括：根据用于获取所述深度学习模型的数据集构建混淆矩阵；根据所述混淆矩阵获取与所述第一标签具有相关性的混淆标签。5.根据权利要求4所述的方法，其特征在于，所述用于获取所述深度学习模型的数据集包括训练集，所述训练集中的每个样本具有参考标签，所述根据用于获取所述深度学习模型的数据集构建混淆矩阵，包括：将所述第一标签与所述训练集中的参考标签进行统计，得...

【专利技术属性】
技术研发人员：张志伟，夏雨，赵伟阳，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人