【技术实现步骤摘要】
一种基于大数据的数据自动标注系统及方法
[0001]本专利技术涉及数据标注
,具体为一种基于大数据的数据自动标注系统及方法。
技术介绍
[0002]计算机视觉技术是人工智能及机器学习发展的重要方向之一,从自动驾驶汽车和医疗诊断技术到无人机和面部识别软件,利用摄影机和电脑代替人眼获取图像或影像信息,通过AI技术来对实现对图像信息的识别、分析过程。
[0003]图像标注在计算机视觉中起着至关重要的作用,在图像识别时,需要足够多的标记样本,当标记样本过少时,会影响深度学习模型的识别准确性,而现有的图像标注多通过人工实现,且在标注过程中需要对标注区域进行准确的划分,在海量的数据标注需求下,此种方式存在标注周期较长,标注成本过高的问题;另外,人工标注的方式无法保证标注的准确性。
技术实现思路
[0004]本专利技术的目的在于提供一种基于大数据的数据自动标注系统及方法,解决以下技术问题:如何自动实现对图像的辅助标注以减少标注的工作量并提高标注准确度。
[0005]本专利技术的目的可以通过以下技术方案 ...
【技术保护点】
【技术特征摘要】
1.一种基于大数据的数据自动标注方法,其特征在于,所述方法包括:步骤一、对大数据进行分类,形成单分类数据组;步骤二、对不同的单分类数据组的数据执行对应的图像轮廓识别策略,根据图像轮廓识别结果按优先级生成若干组预测标注区域;步骤三、按优先级对若干组预测标注区域进行选择,确定最终标注区域;将标记完成的单分类数据组合并,形成标注文件;步骤四、根据选择结果对不同的单分类数据组的优先级进行反馈调整。2.根据权利要求1所述的一种基于大数据的数据自动标注方法,其特征在于,所述图像轮廓识别策略为:S1、采用第一识别算法获取第一识别轮廓;S2、按照对应调整策略对图像进行调参;S3、采用第二识别算法获取第二识别轮廓;S4、根据第一识别轮廓及第二识别轮廓获取预测标注区域;S5、按照对应调整策略调整第一识别算法及第二识别算法并重复步骤S1
‑
S4,获取若干组预测标注区域。3.根据权利要求2所述的一种基于大数据的数据自动标注方法,其特征在于,步骤S2的调参过程包括:对图像进行灰度化处理;通过公式对图像各个像素点的灰度状态进行调整;其中,为原始图片位置点(x,y)对应的灰度值;为原始图片的最大灰度值;为原始图片的最小灰度值;(x,y)为调整后图片位置点(x,y)对应的灰度值。4.根据权利要求3所述的一种基于大数据的数据自动标注方法,其特征在于,步骤S4中预测标注区域获取的过程为:将第一识别轮廓与第二识别轮廓进行重合性比对;通过第一识别轮廓的位置对第二识别轮廓进行修正,获得预测标注区域。5.根据权利要求2所述的一种基于大数据的数据自动标注方法,其特征在于,步骤四中反馈调整的过程为:统计当前单分类数据组被选用预测标注区域的次数...
【专利技术属性】
技术研发人员:苏笑难,邱雨,李兆坤,
申请(专利权)人:安徽云层智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。