数据标注方法、设备及存储介质技术

技术编号:37504997 阅读:27 留言:0更新日期:2023-05-07 09:41
本申请涉及计算机技术领域,提供一种数据标注方法、设备及存储介质,该方法包括响应于用户的操作指令,获取标注需求和待标注数据;根据所述标注需求对所待标注数据进行标注,得到标注数据。通过标注需求的准确获取,简化用户进行数据标注时的操作流程,提高标注数据的有效性,进而实现规模化、精细化的模型训练,提高了用户体验。高了用户体验。高了用户体验。

【技术实现步骤摘要】
数据标注方法、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据标注方法、设备及存储介质。

技术介绍

[0002]目前,随着计算机技术的发展,人工智能已经广泛运用于各种场景,而人工智能的训练需要大量带有标注的数据,来教会机器分析数据间的差异并建立联系。数据标注是构建训练灵活、高表现的机器学习算法的关键步骤,在大数据时代,数据标注变的尤为重要。
[0003]由于数据标注流程复杂、极耗人力、交付漫长,是一项非常繁琐耗费精力的过程,许多用户会通过各类标注平台来获取标记数据。标注平台产出的标注数据的准确性,取决于用户提供的材料数据的有效性,这要求用户具备数据标注相关的专业知识储备,使得用户在数据标注时存在较大的阻碍,难以得到准确的标注数据,进而导致模型训练的门槛过高,难以实现规模化、精细化的模型训练。

技术实现思路

[0004]本申请的主要目的在于提供一种数据标注方法、设备及存储介质,旨在通过标注需求的准确获取,简化用户进行数据标注时的操作流程,提高标注数据的有效性,进而实现规模化、精细化的模型训练,提高了用户体验。
[0005]第一方面,本申请提供一种数据标注方法,所述数据标注方法包括以下步骤:
[0006]响应于用户的操作指令,获取标注需求和待标注数据;
[0007]根据所述标注需求对所待标注数据进行标注,得到标注数据。
[0008]第二方面,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器;
[0009]所述存储器,用于存储计算机程序;
[0010]所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的数据标注方法。
[0011]第三方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的数据标注方法。
[0012]本申请提供一种数据标注方法、设备及存储介质,本申请响应于用户的操作指令,获取标注需求和待标注数据;根据所述标注需求对所待标注数据进行标注,得到标注数据。通过标注需求的准确获取,简化用户进行数据标注时的操作流程,提高标注数据的有效性,进而实现规模化、精细化的模型训练,提高了用户体验。
附图说明
[0013]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1是本申请实施例提供的一种数据标注方法的流程示意图;
[0015]图2是本申请实施例提供的一种数据标注方法的页面示意图;
[0016]图3是本申请实施例提供的一种数据标注方法的流程示意图;
[0017]图4是本申请实施例提供的一种数据标注方法的页面示意图;
[0018]图5是本申请实施例提供的一种计算机设备的示意性框图。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0021]在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0022]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0023]请参阅图1,图1是本申请实施例提供的一种数据标注方法的示意流程图。
[0024]目前,随着人工智能广泛应用于日常生活和工业生产的许多场景中,在金融、智慧城市、制造、交通、自动驾驶、医疗、机器人、教育、互联网等场景有效渗透。然而,传统的算法生产能力与碎片化、多元化所带来的定制需求是相悖的,定制需求要求特定训练的模型,特定的模型又需要根据特定的数据训练得到,而特定的数据是需要对原始数据进行标注才能得到,其中标注的流程复杂、极耗人力、交付时间漫长,这也导致人工智能超大规模与精细化的商业落地陷入瓶颈。
[0025]本申请实施例提供的数据标注方法包括响应于用户的操作指令,获取标注需求和待标注数据;根据所述标注需求对所待标注数据进行标注,得到标注数据。通过标注需求的准确获取,简化用户进行数据标注时的操作流程,提高标注数据的有效性,进而实现规模化、精细化的模型训练,提高了用户体验。
[0026]如图1所示,该数据标注方法包括步骤S101至步骤S102。
[0027]S101、响应于用户的操作指令,获取标注需求和待标注数据。
[0028]其中,待标注数据可以是裸数据或原始数据,即未经处理的图片、文字、音频和视频等数据。标注需求为用户对标注数据的要求,例如待标注的对象,标注采用的方式等,在此不做限定。
[0029]具体地,为了完成快速、高效、高质量的完成个性化数据标注,用户可以通过页面发出操作指令,基于用户的操作指令,获取用户的标注需求,基于此,可以确定本次数据标注适用的标注方法,并基于用户的操作指令获取待标注数据。例如,若用户的标注需求包括标注对象为图片中的人脸,标注方式为2D拉框,可以在页面上传此标注需求,以及待标注的图片。
[0030]在一些实施例中,所述响应于用户的操作指令,获取标注需求和待标注数据,包括:显示数据获取页面,所述数据获取页面用于第一用户上传待标注数据和第一标注需求;响应于所述第一用户在所述数据获取页面的创建操作指令,获取所述第一标注需求和所述待标注数据。
[0031]其中,第一用户是需要获取标注数据的普通用户,可以是不具备数据标注相关的专业知识储备的用户。第一标注需求是第一用户对标注数据的需求描述,可以是基于标注数据的用途产生的需求。
[0032]具体地,显示数据获取页面,第一用户可以基于数据获取页面上传待标注数据和第一标注需求,响应于第一用户在数据获取页面的创建操作指令,获取第一用户上传的第一标注需求和待标注数据。
[0033]在一些实施例中,获取第一标注需求和待标注数据之前还包括:响应于第一用户在数据获取页面的创建操作指令之后,判断待标注数据需要满足预设数量标准,若不满足,则在数据获取页面提示第一用户重新上传或继续上传。
[0034]其中,预设数量标准可以根据实际灵活设定,例如当待标注数据为图片时,预设数量标准可以是对图片张数的限定,当待标注数据为音频时,预设数量标准可以是对音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据标注方法,其特征在于,应用于AI训练平台,所述方法包括:响应于用户的操作指令,获取标注需求和待标注数据;根据所述标注需求对所待标注数据进行标注,得到标注数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述待标注数据的状态;基于所述待标注数据的状态生成标注进度。3.根据权利要求1所述的方法,其特征在于,所述响应于用户的操作指令,获取标注需求和待标注数据,包括:显示数据获取页面,所述数据获取页面用于第一用户上传待标注数据和第一标注需求;响应于所述第一用户在所述数据获取页面的创建操作指令,获取所述第一标注需求和所述待标注数据。4.根据权利要求3所述的方法,其特征在于,所述第一标注需求至少包括标注需求描述、使用场景和标注示例。5.根据权利要求3所述的方法,其特征在于,所述响应于用户的操作指令,获取标注需求和待标注数据,还包括:根据所述第一标注需求生成需求对接页面,显示所述需求对接页面,所述需求对接页面用于向第二用户提供所述第一标注需求和所述待标注数据,并用于所述第二用户上传补充数据;响应于所述第二用户在所述需求对接页面的补充操作指令,获取所述补充数据。6.根据权利要求5所述的方法,其特征在于,所述补充数据包括第二标注需求;所述响应于所述第二用户在所述需求对接页面的补充操作指令,获取所述补充数据,包括:响应于所述第二用户对标注需求文档和标注需求类型的编辑操作指令,获取第二标注需求,所述标注需求文档至少包括标注要求、标注目标及标签、特殊情况及处理方案。7.根据权利...

【专利技术属性】
技术研发人员:刘荣杰黄婉妍李思晋赵丛
申请(专利权)人:共达地创新技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1