一种深度学习标注样本的文件管理系统及方法技术方案

技术编号:22722364 阅读:46 留言:0更新日期:2019-12-04 05:26
本发明专利技术涉及一种深度学习标注样本的文件管理系统及方法,包括客户端以及与客户端交互连接的服务器;客户端包括标注样本重命名模块、标注样本管理模块、标注样本质检模块和数据增广模块,服务器包括数据库。本发明专利技术通过标注样本重命名模块将原始标注样本按照一定的命名方式进行重命名,便于用户选取快速的了解标注样本的基本信息,不需要再次开发代码分析数据,提高对标注样本分析评估的效率。通过标注样本管理模块能够在客户端文件管理界面查询、下载和删除标注样本;通过标注样本质检模块检查删除不符合要求的标注样本,通过数据增广模块对现有的标注样本进行数据增广。本发明专利技术在有效的时间内快速清洗深度学习训练样本,提高了工作效率。

A file management system and method of in-depth learning and labeling samples

The invention relates to a file management system and method for in-depth learning to label samples, including a client and a server which are connected with the client interactively; the client includes a label sample rename module, a label sample management module, a label sample quality inspection module and a data augmentation module, and the server includes a database. The invention renames the original annotation sample according to a certain naming method through the annotation sample renaming module, which is convenient for the user to select and quickly understand the basic information of the annotation sample, does not need to develop the code analysis data again, and improves the efficiency of the analysis and evaluation of the annotation sample. Through the annotation sample management module, we can query, download and delete the annotation samples in the client file management interface; through the annotation sample quality inspection module, we can check and delete the unqualified annotation samples, and through the data augmentation module, we can augment the existing annotation samples. The invention quickly cleans the deep learning training samples in an effective time, and improves the working efficiency.

【技术实现步骤摘要】
一种深度学习标注样本的文件管理系统及方法
本专利技术涉及计算机信息管理领域,尤其涉及一种深度学习标注样本的文件管理系统及方法。
技术介绍
标注样本数据是AI的燃料,这充分说明样本数据在自动驾驶领域的重要性。虽然国内外有很多公开的数据供我们选择,但基本上所有的样本数据的表达方式和存储方式都不同,这些数据都是人工管理,并且管理方式不够统一,这样就会造成大量的人力资源浪费,而且人工作业数据录入的速度慢、准确率低。随着汽车自动驾驶规模的不断发展,描述道路信息的样本数量和种类在不断增加,对样本数据的管理挑战也比较大,但是传统的人工作业模式和样本数据采集的方法难以满足汽车自动驾驶对样本管理的快速、准确要求,严重减缓了相关研究人员的研发进程。由于现有的标注工具针对图片标注的输出文档名称与图片名称是相关联的,利用多个不同的标注软件对同一张图片的标注样本输出也是一样的,当多个标注样本名类似时,如何正确高效的在深度学习标注样本数据库中查找同种类型的标注数据进行重新训练模型也是一个较为耗时的事情。在这种情况下如果不及时按照一定的方式对深度学习标注样本重命名管本文档来自技高网...

【技术保护点】
1.一种深度学习标注样本的文件管理系统,其特征在于,包括客户端以及与客户端交互连接的服务器;所述客户端包括:/n标注样本重命名模块,用于根据原始标注样本的特征信息对原始标注样本进行重命名,并将重命名后的标注样本上传服务器;其中,所述特征信息包括保密级别、重命名时间、图片宽×高、标注方式、图片场景、图片序列号、图片后缀名和标注对象;/n标注样本管理模块:用于在客户端文件管理界面中对服务器中的标注样本进行管理操作;所述管理操作至少包括查询、分析、下载和删除;/n标注样本质检模块,用于检查每一标注样本和样本图片的映射关系,根据检查结果删除或修改错误的标注样本;/n数据增广模块,用于通过预设数据增广方...

【技术特征摘要】
1.一种深度学习标注样本的文件管理系统,其特征在于,包括客户端以及与客户端交互连接的服务器;所述客户端包括:
标注样本重命名模块,用于根据原始标注样本的特征信息对原始标注样本进行重命名,并将重命名后的标注样本上传服务器;其中,所述特征信息包括保密级别、重命名时间、图片宽×高、标注方式、图片场景、图片序列号、图片后缀名和标注对象;
标注样本管理模块:用于在客户端文件管理界面中对服务器中的标注样本进行管理操作;所述管理操作至少包括查询、分析、下载和删除;
标注样本质检模块,用于检查每一标注样本和样本图片的映射关系,根据检查结果删除或修改错误的标注样本;
数据增广模块,用于通过预设数据增广方式对标注样本进行数据增广;
所述服务器,用于存储客户端上传的标注样本。


2.根据权利要求1所述的文件管理系统,其特征在于,所述标注样本重命名模块包括:
标注单元,用于通过标注工具对样本图片进行标注,获得原始标注样本;
重命名单元,用于根据原始标注样本的特征信息对原始标注样本进行重命名;其中,所述特征信息包括保密级别、重命名时间、图片宽×高、标注方式、图片场景、图片序列号、图片后缀名和标注对象;
标注样本上传单元,用于将重命名后获得的标注样本上传服务器。


3.根据权利要求1所述的文件管理系统,其特征在于,所述标注样本管理模块包括:
样本查询单元,用于查询服务器中的标注样本;
样本下载单元,用于下载指定的标注样本;
样本修改单元,用于在判断获知指定标注样本的表达方式错误时,修改对应的标注样本;
样本删除单元,用于向服务器发送指定标注样本的删除指令,以供服务器根据所述删除指令,删除对应的标注样本。


4.根据权利要求1所述的文件管理系统,其特征在于,所述标注样本质检模块包括:
映射关系检查单元,用于检查标注样本和样本图片的数量和名称是否一致,若判断获知标注样本和样本图片的数量或名称不一致,则根据检查结果删除对应的标...

【专利技术属性】
技术研发人员:何云熊迹何豪杰罗跃军
申请(专利权)人:武汉中海庭数据技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1