【技术实现步骤摘要】
基于深度学习的特征字典构建及图像分割方法
本专利技术涉及机器学习
,具体涉及一种基于深度学习的特征字典构建及图像分割方法。
技术介绍
在计算机视觉领域,图像分割指的是为图像中的每个像素分配一个标签的任务,它也可以被看作是densepredictiontask,对图像中每个像素进行分类。和使用矩形候选框的目标检测不同,图像分割需要精确到像素级位置,因此它在医学分析、卫星图像物体检测、虹膜识别和自动驾驶汽车等任务中起着非常重要的作用。随着人工智能特别是深度学习技术的快速发展,基于语义的图像分割技术获得了越来越多的关注。传统的图像分割主要是根据图像的底层特征进行分割,获得的是一个同质的区域,但一般各个区域不能表达太多的语义。而基于语义的图像分割则致力于给每一个像素点标注一个语义标签。传统上,针对图像识别与分类设计的卷积神经网络,如AlexNet、VGG等,通常会在卷积层之后使用若干全连接层,以将卷积层生成的特征图映射为固定长度的特征向量,进而得到整个输入图像在所有分类类别上的归一化概率描述。在这一过程中,图像 ...
【技术保护点】
1.一种基于深度学习的特征字典构建方法,其特征在于,包括:/n制作图像训练数据集,其含有表示目标类别的边框盒;/n使用全卷积自适应网络提取数据集中图像的像素级特征;/n提取图像中目标的边界框和掩膜;/n将掩膜中包含的像素点和所述图像训练数据集中的边框盒进行比对,对掩膜进行分类,形成的所有掩膜以及它们对应的类别即为特征字典。/n
【技术特征摘要】
1.一种基于深度学习的特征字典构建方法,其特征在于,包括:
制作图像训练数据集,其含有表示目标类别的边框盒;
使用全卷积自适应网络提取数据集中图像的像素级特征;
提取图像中目标的边界框和掩膜;
将掩膜中包含的像素点和所述图像训练数据集中的边框盒进行比对,对掩膜进行分类,形成的所有掩膜以及它们对应的类别即为特征字典。
2.根据权利要求1所述的特征字典构建方法,其特征在于,所述图像训练数据集包括OpenImagesV4检测集,其含有190万张图片以及图片上针对600个类别的1540万个边框盒。
3.根据权利要求1所述的特征字典构建方法,其特征在于,所述全卷积自适应神经网络包括:FCN-32s操作单元,具有7个卷积层和5个池化层以及末端的32倍的上采样层;
FCN-16s操作单元,在FCN-32s操作单元的基础上增加一个2*conv7的卷积层、pool4的池化层以及16倍的上采样层;
FCN-8S操作单元,在FCN-32s操作单元的基础上增加一个4*conv7的卷积层、2*pool4的池化层、pool5的池化层以及一个8倍的上采样层。
4.根据权利要求1所述的特征字典构建方法,其特征在于,在提取图像中目标的边界框采用PRN-ROIS网络,得到图像的ROI区域以及所述ROI区域中每个像素的分类权重。
5.根据权利要求4所述的特征字典构建方法,其特征在于,在得到图像的ROI区域以后,将每个ROI区域的内部和外部特征图组合成两张完整的特征图,然后同步进行图像分割和图像分类两个分支:
在图像分割中,使用softma...
【专利技术属性】
技术研发人员:张庆辉,王彩红,张东林,常夏宁,吴小雪,
申请(专利权)人:河南工业大学,郑州艾毅电子科技有限公司,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。