【技术实现步骤摘要】
一种数据标注方法、装置、存储介质及计算机设备
本申请涉及数据处理
,尤其是涉及到一种数据标注方法、装置、存储介质及计算机设备。
技术介绍
人工智能算法建模需要大量标注的有监督数据,在数据标注的过程中,由于数据量大,数据多样性高,会存在大量难以标注的问题样本,对于这些样本标注人员可能无法很好识别,标注人员在询问和等待回复的过程中,会造成大量的时间浪费从而影响标注进度。且不同标注人员可能会遇到相似的问题样本,同一标注人员也会重复遇到相似的问题样本,多次相似的问题导致重复讨论严重影响整体效率。在已知的数据标注系统、平台或者方法中只包含数据的标注和验收,缺少对问题样本的统一管理,问题样本的存在严重影响着标注任务的整体效率。若能提高样本数据的标注效率,将有助于人工智能算法建模的发展进步。
技术实现思路
有鉴于此,本申请提供了一种数据标注方法、装置、存储介质及计算机设备。根据本申请的一个方面,提供了一种数据标注方法,所述方法包括接收目标数据;查询已标注数据集合中是否存在与所述目标 ...
【技术保护点】
1.一种数据标注方法,其特征在于,所述方法包括/n接收目标数据;/n查询已标注数据集合中是否存在与所述目标数据之间的相似度满足预设参考数据相似度条件的参考数据;/n若存在,则输出与所述目标数据对应的满足所述预设参考数据相似度条件的所述参考数据。/n
【技术特征摘要】
1.一种数据标注方法,其特征在于,所述方法包括
接收目标数据;
查询已标注数据集合中是否存在与所述目标数据之间的相似度满足预设参考数据相似度条件的参考数据;
若存在,则输出与所述目标数据对应的满足所述预设参考数据相似度条件的所述参考数据。
2.根据权利要求1所述的方法,其特征在于,所述参考数据包含有数据标签,所述输出与所述目标数据对应的满足所述预设参考数据相似度条件的所述参考数据之后,所述方法还包括:
接收与所述参考数据对应的输出反馈信息,其中,所述输出反馈信息用于指示所述参考数据的数据标签是否适用于标注所述目标数据;
若所述参考数据的数据标签适用于标注所述目标数据,则基于所述参考数据的数据标签标注所述目标数据,并将得到的已标注数据加入至所述已标注数据集合中;
若所述参考数据的数据标签不适用于标注所述目标数据,则将所述目标数据加入待标注数据列表中。
3.根据权利要求1所述的方法,其特征在于,所述查询已标注数据集合中是否存在与所述目标数据之间的相似度满足预设参考数据相似度条件的参考数据之后,所述方法还包括:
若不存在,则将所述目标数据加入所述待标注数据列表中。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
接收标注信息,其中,所述标注信息包括所述待标注列表中包含的待标注数据及其对应的数据标签;
按照所述标注信息的数据标签对相应所述待标注数据进行标注,并将标注后得到的已标注数据加入至所述已标注数据集合中。
5.根据权利要求4所述的方法,其特征在于,所述查询已标注数据集合中是否存在与所述目标数据之间的相似度满足预设参考数据相似度条件的参考数据,具体包括:
分别计算所述目标数据与所述已标注数据集合中任一已标注数据之间的相似度;
若最高的所述相似度大...
【专利技术属性】
技术研发人员:刘一鹏,
申请(专利权)人:大箴杭州科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。