数据处理方法及装置、计算机可读存储介质制造方法及图纸

技术编号:28462036 阅读:17 留言:0更新日期:2021-05-15 21:27
一种数据处理方法及装置、计算机可读存储介质,其中,所述方法包括:获取针对目标项目的第一数据集(201),按照目标项目的识别目的生成第一数据对应的第一标注数据集(202),对第一标注数据集进行模型训练,生成第一练模型(203),在第一训练模型的准确度信息满足部署条件的情况下,输出一训练模型(204)。上述方法可以高效、便捷、灵活地生成并部署训练模型。灵活地生成并部署训练模型。灵活地生成并部署训练模型。

【技术实现步骤摘要】
【国外来华专利技术】数据处理方法及装置、计算机可读存储介质


[0001]本申请涉及人工智能
,尤其涉及一种数据处理方法及装置、计算机可读存储介质。

技术介绍

[0002]人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的研究领域包括机器人、语言识别、图像识别、自然语音处理和专家系统等领域。人工智能的实现大多依赖于训练模型,训练模型是通过对大量训练数据进行自主学习,生成的模型。其中,数据的类型可以包括但不限于图像、视频、音频、物体、文本等。
[0003]如何高效、便捷地生成并部署训练模型是亟待解决的技术问题。

技术实现思路

[0004]本申请实施例公开了一种数据处理方法及装置、计算机可读存储介质,可以高效、便捷地生成并部署训练模型。
[0005]第一方面,本申请实施例提供了一种数据处理方法,该方法包括:
[0006]获取针对目标项目的第一数据集;
[0007]按照所述目标项目的识别目的生成所述第一数据集对应的第一标注数据集;
[0008]对所述第一标注数据集进行模型训练,生成第一训练模型;
[0009]在所述第一训练模型的准确度信息满足部署条件的情况下,输出所述第一训练模型。
[0010]第二方面,本申请实施例提供了一种数据处理装置,所述数据处理装置包括:输入单元、处理单元和输出单元;
[0011]所述输入单元,用于获取针对目标项目的第一数据集
[0012]所述处理单元,用于按照所述目标项目的识别目的生成所述第一数据集对应的第一标注数据集;对所述第一标注数据集进行模型训练,生成第一训练模型;
[0013]所述输出单元,用于在所述处理单元确定出所述第一训练模型的准确度信息满足部署条件的情况下,输出所述第一训练模型。
[0014]第三方面,本申请实施例提供了一种数据处理装置,包括处理器和存储器,所述存储器用于存储计算机指令,当所述处理器执行所述计算机指令时,以使所述数据处理装置执行上述第一方面所述的方法。
[0015]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可以实现上述第一方面所述的方法。
[0016]本申请实施例中,通过获取针对目标项目的第一数据集,可以实现数据采集;通过生成第一标注数据集,可以实现数据标注;通过对第一标注数据集进行模型训练,可以实现
模型生成;通过判断训练模型是否满足部署条件,可实现模型部署;从而可以高效、便捷、灵活地生成并部署训练模型。以项目的形式对数据采集、数据标注、模型生成和模型部署这一系列过程进行管理,可以提高训练模型应用的便捷性和可行性。
附图说明
[0017]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本申请实施例提供的一种网络架构的示意图;
[0019]图2是本申请实施例提供的一种数据处理方法的流程示意图;
[0020]图3是本申请实施例提供的一种数据处理方法的场景示意图;
[0021]图4是本申请实施例提供的创建项目的界面示意图;
[0022]图5是本申请实施例提供的某个计划的界面示意图;
[0023]图6是本申请实施例提供的一种数据处理装置的结构示意图;
[0024]图7是本申请实施例公开的一种终端设备的结构示意图。
具体实施方式
[0025]在对本申请实施例提供的技术方案介绍之前,先对本申请实施例涉及的名称或术语进行介绍。
[0026](1)训练模型
[0027]训练模型,指的是通过大量训练数据对所选的算法进行自适应调整(或称为自主学习),得到的模型。训练模型可以应用于机器学习、语言识别、图像识别等领域。例如,训练模型应用于图像识别领域,可以实现对图像中猫或狗的识别。
[0028](2)数据集、标注数据集
[0029]数据集,指的是未标注的数据集,可以包括一个或多个未标注的数据。未标注的数据,即数据上不存在标注痕迹。例如,图像上不存在标注痕迹。
[0030]标注数据集,指的是标注的数据集,可以包括一个或多个标注的数据。标注的数据,即数据上存在标注痕迹。例如,图像上存在标注痕迹。
[0031]在本申请实施例中,数据以图像为例进行介绍。
[0032]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0033]请参阅图1,为本申请实施例提供的一种网络架构的示意图。该网络架构景可包括用户、数据处理装置101和应用设备102。
[0034]其中,数据处理装置101可以是终端设备,也可以是与终端设备匹配使用的装置,例如处理器等。终端设备可以包括但不限于个人计算机(Personal Computer,PC)、笔记本电脑、平板电脑、智能手机(如Android手机等)、移动互联网设备(Mobile Internet Devices,MID)等。应用在本申请实施例中,数据处理装置101具有生成训练模型的能力。
[0035]其中,应用设备102可以包括但不限于机器人、飞行器、汽车、智能家电、可穿戴设
备、虚拟现实(Virtual Reality,VR)设备、监控摄像设备、智能手机、平板电脑、MID、PC等设备。应用在本申请实施例中,应用设备102具有部署训练模型能力。
[0036]图1所示的数据处理装置101以PC为例,应用设备102以智能机器人、汽车和飞行器为例,各个设备的形态和数量用于举例,并不构成对本申请实施例的限定。
[0037]在本申请实施例中,数据处理装置101可根据用户输入的项目创建指令创建项目,项目可以是人工智能(Artificial Intelligence,AI)项目,AI项目可用于实现某种目的,例如用于实现对图像中的猫或狗等的识别。数据处理装置101在接收到针对项目的数据集的情况下,可按照该项目的识别目的生成该数据集对应的标注数据集,对该标注数据集进行模型训练,生成训练模型。
[0038]若该训练模型满足部署条件,则数据处理装置101可输出该训练模型,可将该训练模型输出至应用设备102,以便在应用设备102上部署该训练模型,从而应用设备102可以实现该识别目的。数据处理装置101也可自己部署该训练模型,即在数据处理装置101上部署该训练模型,从而数据处理装置101可以实现该识别目的。数据处理装置101还可将该训练模型输出至第三方平台,以便在第三方平台上部署该训练模型。第三方平台可以是图像识别平台或AI视觉识别平台等。
[0039]示例性的,假设用户需要训练监控摄像设备识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种数据处理方法,其特征在于,所述方法包括:获取针对目标项目的第一数据集;按照所述目标项目的识别目的生成所述第一数据集对应的第一标注数据集;对所述第一标注数据集进行模型训练,生成第一训练模型;在所述第一训练模型的准确度信息满足部署条件的情况下,输出所述第一训练模型。2.根据权利要求1所述的方法,其特征在于,所述按照所述目标项目的识别目的生成所述第一数据集对应的第一标注数据集,包括:按照所述目标项目的识别目的,根据针对所述第一数据集中的第一数据的标注指令,生成所述第一数据集对应的第一标注数据集。3.根据权利要求1所述的方法,其特征在于,所述按照所述目标项目的识别目的生成所述第一数据集对应的第一标注数据集,包括:按照所述目标项目的识别目的,调用标注模型对所述第一数据集中的第一数据进行标注处理,生成所述第一数据集对应的第一标注数据集。4.根据权利要求1

3任一项所述的方法,其特征在于,所述方法还包括:统计所述第一标注数据集中已标注的数据数量、无效数据的数量和标注的对象数量。5.根据权利要求1

3任一项所述的方法,其特征在于,所述对所述第一标注数据集进行模型训练,生成第一训练模型,包括:调用目标训练模型对所述第一标注数据集进行模型训练,生成第一训练模型。6.根据权利要求1

3任一项所述的方法,其特征在于,所述对所述第一标注数据集进行模型训练,生成第一训练模型,包括:获取处于空闲态的数据处理服务器,调用所述数据处理服务器对所述第一标注数据集进行模型训练,生成第一训练模型。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:调用所述第一训练模型对参考数据集进行测试,得到测试结果;对比所述测试结果与所述参考数据集对应的参考标注结果,得到并输出所述第一训练模型的准确度信息。8.根据权利要求7所述的方法,其特征在于,所述准确度信息包括整体准确度和评判项准确度;所述准确度信息满足所述...

【专利技术属性】
技术研发人员:薛冰徐升张永耿
申请(专利权)人:深圳市微蓝智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1