【技术实现步骤摘要】
数据标注方法以及相关装置
本申请涉及人工智能
,特别是涉及一种数据标注方法以及相关装置。
技术介绍
随着近几年,深度学习、机器学习等AI(ArtificialIntelligence,人工智能)领域取得了巨大突破,AI技术在各个领域得到了广泛和深入的应用。此外,数据标签被誉为人工智能领域的“粮食”,故此,数据标注自然而然成为人工智能领域中的一个热点。目前,数据标注的效率与质量往往是人工智能领域所关注的重点。有鉴于此,如何提高数据标注的效率和质量成为亟待解决的问题。
技术实现思路
本申请主要解决的技术问题是提供一种数据标注方法以及相关装置,能够提高数据标注的效率和质量。为了解决上述问题,本申请第一方面提供了一种数据标注方法,包括:将待标注数据输入层级标注系统,确定待标注数据在层级标注系统中推荐的数据标签;其中,层级标注系统每一层包含至少一个数据标签,每个数据标签包含至少一个子标签,和/或,每个数据标签包含一个父标签;层级标注系统包括推荐模型,推荐的数据标签是通过推荐模型推荐得到的;基于 ...
【技术保护点】
1.一种数据标注方法,其特征在于,包括:/n将待标注数据输入层级标注系统,确定所述待标注数据在所述层级标注系统中推荐的数据标签;/n其中,所述层级标注系统每一层包含至少一个数据标签,每个所述数据标签包含至少一个子标签,和/或,每个所述数据标签包含一个父标签;所述层级标注系统包括推荐模型,所述推荐的数据标签是通过所述推荐模型推荐得到的;/n基于所述待标注数据在所述层级标注系统中推荐的数据标签,确定所述待标注数据所属的所述数据标签的子标签;/n根据确定的子标签更新所述待标注数据的当前数据标签。/n
【技术特征摘要】
1.一种数据标注方法,其特征在于,包括:
将待标注数据输入层级标注系统,确定所述待标注数据在所述层级标注系统中推荐的数据标签;
其中,所述层级标注系统每一层包含至少一个数据标签,每个所述数据标签包含至少一个子标签,和/或,每个所述数据标签包含一个父标签;所述层级标注系统包括推荐模型,所述推荐的数据标签是通过所述推荐模型推荐得到的;
基于所述待标注数据在所述层级标注系统中推荐的数据标签,确定所述待标注数据所属的所述数据标签的子标签;
根据确定的子标签更新所述待标注数据的当前数据标签。
2.根据权利要求1所述的数据标注方法,其特征在于,所述将待标注数据输入层级标注系统,确定所述待标注数据在所述层级标注系统中推荐的数据标签包括:
将所述待标注数据输入所述层级标注系统的推荐模型中,获取所述待标注数据属于所述层级标注系统中各个数据标签的置信度;
将置信度最高的数据标签推荐为所述待标注数据在所述层级标注系统中的数据标签;
所述基于所述待标注数据在所述层级标注系统中推荐的数据标签,确定所述待标注数据所属的所述数据标签的子标签包括:
对确定推荐的数据标签的所述待标注数据分类标注子标签;
所述根据确定的子标签更新所述待标注数据的当前数据标签包括:
将对所述待标注数据标注的子标签作为所述待标注数据的当前数据标签。
3.根据权利要求2所述的数据标注方法,其特征在于,所述方法还包括:
获取对所述待标注数据标注的非本类标识,其中,所述非本类标识是基于所述待标注数据不属于对应的数据标签中任何一个子标签而标注的;
根据所述置信度将所述待标注数据流转至与所述当前数据标签同一层的其他数据标签,将所述其他数据标签作为所述待标注数据在所述层级标注系统中推荐的数据标签;
并重新执行对确定推荐的数据标签的所述待标注数据标注子标签的步骤以及后续步骤。
4.根据权利要求3所述的数据标注方法,其特征在于,所述方法还包括:
若所述待标注数据的非本类标识个数大于预设阈值,则将所述待标注数据流转至错误数据集。
...
【专利技术属性】
技术研发人员:刘睿,靳丁南,罗欢,权圣,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。