一种图像数据集辅助标记系统及方法技术方案

技术编号:19594030 阅读:18 留言:0更新日期:2018-11-28 05:06
本发明专利技术公开了一种图像数据集辅助标记系统及方法,旨在解决现有技术中采用人工方法对数据集进行标记方法费时费力且准确性低的问题;本发明专利技术利用神经网络训练的思想对神经网络训练所需的图像进行初步特征提取训练,对图像进行识别标记获得神经网络所需的标签文档格式,在大量的图像信息中获得某一类的标签文档,解决了现有的人工方法对数据集进行标记方法费时费力且准确性低的问题,扩展了数据集以及提高数据集生成的效率及准确性;本发明专利技术适用于图像数据预处理相关领域。

【技术实现步骤摘要】
一种图像数据集辅助标记系统及方法
本专利技术涉及涉及图像数据预处理相关领域,具体涉及一种图像数据集辅助标记系统及方法。
技术介绍
“机器学习”一般被定义为一个系统自我改进的过程。从最初的基于神经元模型以及函数逼近论的方法研究,到以符号演算为基础的规则学习和决策树学习的产生,和以后的认知心理学中归纳、解释、类比等概念的引入,至最新的计算学习理论和统计学习的兴起,机器学习一直都在相关学科的实践应用中起着主导作用。这门学科所关注的重点问题是:计算机程序如何随着经验积累自动提高性能。近年来,机器学习被成功地应用于很多领域,包括检测信用卡交易欺诈的数据挖掘程序,获取用户阅读兴趣的信息过滤系统,以及能在高速公路上自动行驶的汽车等等。与此相辅相成的是,机器学习学科的基础理论和算法也有了相当重大的进展。物体检测是机器学习中相当重要的应用分支,它经历了传统的人工设计特征+浅层分类器的框架,到基于大数据和深度神经网络End-To-End的物体检测框架的发展。物体检测的流程可以大致包括:图像预处理-图像分割-特征提取-判断匹配-输出结果。针对特征提取的方法不同,也分为人工特征提取和利用卷积神经网络的机器提本文档来自技高网...

【技术保护点】
1.一种图像数据集辅助标记系统,其特征在于,包括图像获取模块、图像特征提取模块、数据集扩充模块、图像识别定位模块、防错检查模块和文档生成模块;所述图像获取模块:获取样本图像数据库以及目标图像数据库;所述图像特征提取模块:获取图像获取模块所发送的样本图像数据库并提取得到样本图像特征,并获取图像获取模块所发送的目标图像数据库并提取得到目标图像特征;所述图像识别定位模块:获取图像特征提取模块所发送的样本图像特征并训练得到图像识别分类器,根据识别分类器对图像特征提取分类后的目标图像特征识别定位;所述数据集扩充模块:接收图像识别定位模块所输出的目标图像数据库并扩充得到目标图像数据集;所述防错检查模块:接...

【技术特征摘要】
1.一种图像数据集辅助标记系统,其特征在于,包括图像获取模块、图像特征提取模块、数据集扩充模块、图像识别定位模块、防错检查模块和文档生成模块;所述图像获取模块:获取样本图像数据库以及目标图像数据库;所述图像特征提取模块:获取图像获取模块所发送的样本图像数据库并提取得到样本图像特征,并获取图像获取模块所发送的目标图像数据库并提取得到目标图像特征;所述图像识别定位模块:获取图像特征提取模块所发送的样本图像特征并训练得到图像识别分类器,根据识别分类器对图像特征提取分类后的目标图像特征识别定位;所述数据集扩充模块:接收图像识别定位模块所输出的目标图像数据库并扩充得到目标图像数据集;所述防错检查模块:接收并检查数据集扩充模块所输出的目标图像数据集并检查是否有错误的目标图像,若有,则将目标图像返回至图像识别定位模块继续识别定位,若无,则输出准确目标图像数据集;所述文档生成模块:接收防错检查模块所输出的准确目标图像数据集并生成标签文档格式。2.一种图像数据集辅助标记方法,其特征在于,包括以下步骤:步骤1:获取样本图像数据库以及目标图像数据库;步骤2:获取样本图像数据库并提取得到样本图像特征,并获取目标图像数据库并提取得到目标图像特征;步骤3:获取样本图像特征并训练得到图像识别分类器,根据识别分类器对图像特征提取分类后的目标图像特征识别定位;步骤4:接收步骤3所输出的标记的目标图像数据库并扩充得到目标图像数据集;步骤5:接收并检查目标图像数据集并检查是否有错误的目标图像,若有,则将目标图像返回至步骤4继续识别定位,若无,则输出准确目标图像数据集;步骤6:接收准确目标图像数据集并生成标签文档格式。3.如权利要求2所述的一种图像数据集辅助标记方法,其特征在于,所述步骤3的具体步骤为:步骤3.1:利用神经网络对样本图像特征训练得到图像识别分类器;步骤3.2:利用图像识别分类器对目标图像特征识别定位得到边界框信息包括label,x,y,w,h,label代表该类分类的名称,x代表识别定位框左上角横坐标的像素值,y代表识别定位框左上角纵坐标的像素值,w指的是定位框的宽度,h指的是定位框的高度。4.如权利要求3所述的一种图像数据集辅助标记方法,其特征在于,所述步骤4的具体步骤为:步骤4.1:获取标记的目标图像数据库,边界框信息坐标为(x,y,w,h);步骤4.2:图像的中心点作为坐标原点,根据识别框坐标得...

【专利技术属性】
技术研发人员:姜柏帆张岚程平杨正军
申请(专利权)人:四川奇迹云科技有限公司四川虹电数字家庭产业技术研究院有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1