基于深度学习的特征字典构建及图像分割方法技术

技术编号:24757983 阅读:111 留言:0更新日期:2020-07-04 09:34
本发明专利技术公开了一种基于深度学习的特征字典构建及图像分割方法,旨在解决现有技术中定位不精确,细节不敏感的技术问题本发明专利技术。本发明专利技术包括以下步骤:制作图像训练数据集,其含有表示目标类别的边框盒;使用全卷积自适应网络提取数据集中图像的像素级特征;提取图像中目标的边界框和掩膜;将掩膜中包含的像素点和训练数据集中的边框盒进行比对,对掩膜进行分类,形成的所有掩膜以及它们对应的类别即为特征字典。本发明专利技术的有益技术效果在于:兼顾精度和效率,不要求图像尺寸相同,适应性强。

Feature dictionary construction and image segmentation based on deep learning

【技术实现步骤摘要】
基于深度学习的特征字典构建及图像分割方法
本专利技术涉及机器学习
,具体涉及一种基于深度学习的特征字典构建及图像分割方法。
技术介绍
在计算机视觉领域,图像分割指的是为图像中的每个像素分配一个标签的任务,它也可以被看作是densepredictiontask,对图像中每个像素进行分类。和使用矩形候选框的目标检测不同,图像分割需要精确到像素级位置,因此它在医学分析、卫星图像物体检测、虹膜识别和自动驾驶汽车等任务中起着非常重要的作用。随着人工智能特别是深度学习技术的快速发展,基于语义的图像分割技术获得了越来越多的关注。传统的图像分割主要是根据图像的底层特征进行分割,获得的是一个同质的区域,但一般各个区域不能表达太多的语义。而基于语义的图像分割则致力于给每一个像素点标注一个语义标签。传统上,针对图像识别与分类设计的卷积神经网络,如AlexNet、VGG等,通常会在卷积层之后使用若干全连接层,以将卷积层生成的特征图映射为固定长度的特征向量,进而得到整个输入图像在所有分类类别上的归一化概率描述。在这一过程中,图像的空间信息被丢弃,使本文档来自技高网...

【技术保护点】
1.一种基于深度学习的特征字典构建方法,其特征在于,包括:/n制作图像训练数据集,其含有表示目标类别的边框盒;/n使用全卷积自适应网络提取数据集中图像的像素级特征;/n提取图像中目标的边界框和掩膜;/n将掩膜中包含的像素点和所述图像训练数据集中的边框盒进行比对,对掩膜进行分类,形成的所有掩膜以及它们对应的类别即为特征字典。/n

【技术特征摘要】
1.一种基于深度学习的特征字典构建方法,其特征在于,包括:
制作图像训练数据集,其含有表示目标类别的边框盒;
使用全卷积自适应网络提取数据集中图像的像素级特征;
提取图像中目标的边界框和掩膜;
将掩膜中包含的像素点和所述图像训练数据集中的边框盒进行比对,对掩膜进行分类,形成的所有掩膜以及它们对应的类别即为特征字典。


2.根据权利要求1所述的特征字典构建方法,其特征在于,所述图像训练数据集包括OpenImagesV4检测集,其含有190万张图片以及图片上针对600个类别的1540万个边框盒。


3.根据权利要求1所述的特征字典构建方法,其特征在于,所述全卷积自适应神经网络包括:FCN-32s操作单元,具有7个卷积层和5个池化层以及末端的32倍的上采样层;
FCN-16s操作单元,在FCN-32s操作单元的基础上增加一个2*conv7的卷积层、pool4的池化层以及16倍的上采样层;
FCN-8S操作单元,在FCN-32s操作单元的基础上增加一个4*conv7的卷积层、2*pool4的池化层、pool5的池化层以及一个8倍的上采样层。


4.根据权利要求1所述的特征字典构建方法,其特征在于,在提取图像中目标的边界框采用PRN-ROIS网络,得到图像的ROI区域以及所述ROI区域中每个像素的分类权重。


5.根据权利要求4所述的特征字典构建方法,其特征在于,在得到图像的ROI区域以后,将每个ROI区域的内部和外部特征图组合成两张完整的特征图,然后同步进行图像分割和图像分类两个分支:
在图像分割中,使用softma...

【专利技术属性】
技术研发人员:张庆辉王彩红张东林常夏宁吴小雪
申请(专利权)人:河南工业大学郑州艾毅电子科技有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1