数据标注方法、设备及存储介质技术

技术编号:37774437 阅读:13 留言:0更新日期:2023-06-06 13:41
本申请涉及计算机技术领域,提供一种数据标注方法、设备及存储介质,该方法包括获取标注需求、标注模式和待标注数据;基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据。通过提供多种标注模式,并灵活调用多种标注模式来实现快速、高效、高质量地个性化数据标注,提高了用户的使用体验。提高了用户的使用体验。提高了用户的使用体验。

【技术实现步骤摘要】
数据标注方法、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据标注方法、设备及存储介质。

技术介绍

[0002]目前,随着计算机技术的发展,人工智能已经广泛运用于各种场景,而人工智能的训练需要大量带有标注的数据,来教会机器分析数据间的差异并建立联系。数据标注是构建训练灵活、高表现的机器学习算法的关键步骤,在大数据时代,数据标注变的尤为重要。
[0003]数据标注是一项非常繁琐耗费精力的过程,许多用户会通过各类标注平台来获取标记数据。由于现有标注平台的标注流程固化,对不同的标注任务往往提供同样的标注流程,导致标注平台产出的标注数据的准确性低,交付期间长,用户体验不佳。

技术实现思路

[0004]本申请的主要目的在于提供一种数据标注方法、设备及存储介质,旨在通过提供多种标注模式,并灵活调用多种标注模式来实现快速、高效、高质量地个性化数据标注,提高了用户的使用体验。
[0005]第一方面,本申请提供一种数据标注方法,所述数据标注方法包括以下步骤:
[0006]获取标注需求、标注模式和待标注数据;
[0007]基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据。
[0008]第二方面,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器;
[0009]所述存储器,用于存储计算机程序;
[0010]所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的数据标注方法。<br/>[0011]第三方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的数据标注方法。
[0012]本申请提供一种数据标注方法、设备及存储介质,本申请获取标注需求、标注模式和待标注数据;基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据。通过提供多种标注模式,并灵活调用多种标注模式来实现快速、高效、高质量地个性化数据标注,提高了用户的使用体验。
附图说明
[0013]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1是本申请实施例提供的一种数据标注方法的流程示意图;
[0015]图2是本申请实施例提供的另一种数据标注方法的流程示意图;
[0016]图3是本申请实施例提供的一种数据标注方法的页面示意图;
[0017]图4是本申请实施例提供的一种数据标注方法的流程示意图;
[0018]图5是本申请实施例提供的一种计算机设备的示意性框图。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0021]在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0022]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0023]请参阅图1,图1是本申请实施例提供的一种数据标注方法的流程示意图。
[0024]目前,随着人工智能广泛应用于日常生活和工业生产的许多场景中,在金融、智慧城市、制造、交通、自动驾驶、医疗、机器人、教育、互联网等场景有效渗透。然而,传统的算法生产能力与碎片化、多元化发展所带来的定制需求是相悖的,定制需求要求特定训练的模型,特定的模型又需要根据特定的数据训练得到,而特定的数据是需要对原始数据进行标注才能得到,其中标注的流程复杂、极耗人力、交付时间漫长,这也导致人工智能超大规模与精细化的商业落地陷入瓶颈。
[0025]本申请实施例提供的数据标注方法包括获取标注需求、标注模式和待标注数据;基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据。通过提供多种标注模式,并灵活调用多种标注模式来实现快速、高效、高质量地个性化数据标注,提高了用户的使用体验。
[0026]如图1所示,该数据标注方法包括步骤S101至步骤S102。
[0027]S101、获取标注需求、标注模式和待标注数据。
[0028]其中,待标注数据可以是裸数据或原始数据,即未经处理的图片、文字、音频和视频等数据,也可以是裸数据、原始数据或部分已完成标注的标注示例。标注需求为用户对标注操作的要求,包括待标注的对象,标注采用的方式等,例如用红色框体标注出图片中的人脸。标注模式是用户选定的标注方案,可以预先设置多种模式供用户选择,例如手动标注模式、智能标注模式等。
[0029]具体地,获取用户上传的标注需求和待标注数据,用于后续进行标注操作,获取用户选择的标注模式,用于确定进行标注操作的具体方案。
[0030]在一些实施例中,所述标注模式至少包括模型标注模式、小样本标注模式、手动标注模式。
[0031]具体地,为了提高了用户的使用体验,本申请实施例提供模型标注模式、小样本标
注模式、手动标注模式三种标注模式,用于满足用户不同的标注需求。模型标注模式是通过预先训练的标注模型对待标注数据进行标注操作,能够简化用户进行数据标注时的操作流程;小样本标注模式是以部分待标注数据标注为样本优化训练模型,再利用优化训练后的模型进行标注操作,能够有效提高标注数据的准确性;手动标注模式是通过人工手动标注的方式进行标注操作,能够实现用户自主的标注操作。
[0032]S102、基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据。
[0033]具体地,基于标注模式确定应当启动的标注操作类型,根据标注需求对待标注数据进行对应的标注操作。
[0034]在一些实施例中,所述基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据,包括:当所述标注模式为所述模型标注模式时,获取目标标注模型;基于所述标注需求,利用所述目标标注模型对所述待标注数据进行标注,得到所述标注数据。
[0035]其中,目标标注模型是与当前标注任务适配的标注模型,可以由标注需求、待标注数据的类型确定目标标注模型。例如标注需求是标注出图片中的人脸,则对应的标注模型可以是目标检测模型,又例如,待标注数据为图片本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据标注方法,其特征在于,应用于AI训练平台,所述方法包括:获取标注需求、标注模式和待标注数据;基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据。2.根据权利要求1所述的方法,其特征在于,所述标注模式至少包括模型标注模式、小样本标注模式、手动标注模式。3.根据权利要求2所述的方法,其特征在于,所述基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据,包括:当所述标注模式为所述模型标注模式时,获取目标标注模型;基于所述标注需求,利用所述目标标注模型对所述待标注数据进行标注,得到所述标注数据。4.根据权利要求3所述的方法,其特征在于,所述获取目标标注模型之前,包括:判断所述待标注数据是否满足预设需求;当所述待标注数据满足所述预设需求时,根据所述标注需求和预设的需求模型映射关系表,获取所述目标标注模型,所述预设的需求模型映射关系表用于记录所述标注需求与所述目标标注模型之间的映射关系。5.根据权利要求4所述的方法,其特征在于,当所述待标注数据不满足所述预设需求时,则切换所述模型标注模式为所述小样本标注模式或所述手动标注模式。6.根据权利要求2所述的方法,其特征在于,所述基于所述标注需求和所述标注模式对所述待标注数据进行标注,得到标注数据,包括:当所述标注模式为所述小样本标注模式时,按照预设划分规则划分所述待标注数据,得到第一数据和第二数据;对所述第一数据进行数据标注,得到样本标注数据,其中所述样本标注数据满足预设需求;根据所述标注需求和预设的需求模型映射关系表,获取对应的目标标注模型;基于所述样本标注数据和所述标注需求训练所述目标标注模型,得到训练后的目标标注模型;基于所述标注需求,利用所述训练...

【专利技术属性】
技术研发人员:刘荣杰黄婉妍李思晋赵丛
申请(专利权)人:共达地创新技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1