图像分割方法及装置制造方法及图纸

技术编号:18555076 阅读:120 留言:0更新日期:2018-07-28 11:40
本发明专利技术涉及一种图像分割方法及装置,所述图像分割方法包括步骤:深度学习以得到FCN网络模型,且在深度学习过程中,使用L(pji)=‑(1‑pji)rlog(pji)进行损失计算;将待分割图像输入最后一次更新的FCN网络模型中,得到待分割图像中每个像素为各种类别的概率,选择概率最大值对应的类别为该个像素图像分割所确定的类别。本发明专利技术通过对FCN网络模型的损失函数进行改进,提高对图像分类的准确性,实现了利用像素分类的方式准确提提电子文档中的图表信息。

【技术实现步骤摘要】
图像分割方法及装置
本专利技术涉及数据处理
,特别涉及一种基于FCN网络模型的图像分割方法及装置。
技术介绍
用于图像分割的深度学习网络包括了U-NET、SEGNET等FCN(全卷积网络)网络,此类网络在一些自然场景的可以实现像素语意分割。目前已有的基于深度学习的分割模型中,最终的像素分类均是按照一般的分类模型(交叉熵)损失定义的。一般情况下,分类模型要求各类别样本数量尽量均等,若存在某个或某些类别下的样本数量远大于另一些类别下的样本数量,即类别不平衡,学习效果一般不甚理想。例如在chart图像中,背景像素占了绝大多数的面积,而title的文字仅占极小的比例,出现了类别极不平衡的状态,如采用标准的多分类交叉熵损失函数进行分类,分类模型更倾向将所有的像素均分类成背景,导致像素分割不准确。
技术实现思路
本专利技术的目的在于改善现有技术中所存在的类别不平衡时像素分割不准确的不足,提供一种可以提高像素分割准确性的图像分割方法及装置。为了实现上述专利技术目的,本专利技术实施例提供了以下技术方案:一方面,本专利技术实施例中提供了一种图像分割方法,包括以下步骤:步骤A,将一张样本图像输入已初始化的FCN网络模型中,得到当前模型参数下样本图像中每个像素分类的概率pji,pji表示样本图像中第j个像素为第i类的概率;步骤B,采用如下公式对步骤A中的输出结果进行损失计算,并求取一张样本图像中所有像素的平均损失L(pji)=-(1-pji)rlog(pji),式中,L(pji)为第j个像素的损失,r为0~4之间的实数;步骤C,求解最小化并更新FCN网络模型中所有的学习参数;步骤D,循环执行步骤A~步骤C,直至设定的迭代次数;步骤E,将待分割图像输入最后一次更新的FCN网络模型中,得到待分割图像中每个像素为各种类别的概率,选择概率最大值对应的类别为该个像素图像分割所确定的类别。在采用标准的损失函数时,对于像素极少的类别,如图例文字等分类错误比例较大,上述方法采用改进后的损失函数进行损失计算,在训练过程中收敛速度加快,对图例文字等少像素类别的分割效果优于传统的交叉熵损失,大大提高像素分类的准确性。另一方面,本专利技术实施例提供了一种图像分割装置,包括:参数设置模块,用于设置所述FCN网络模型中的学习参数,包括初始化FCN网络模型中的学习参数,以及在迭代过程中更新FCN网络模型中的学习参数;图像输入模块,用于将待分割的样本图像输入到所述FCN网络模型;概率输出模块,用于从所述FCN网络模型输出当前模型参数下所述样本图像中每个像素分类的概率pji,pji表示图像中第j个像素为第i类的概率;损失计算模块,用于采用如下公式对所述概率输出模块的输出结果进行损失计算,并求取一张图像中所有像素的平均损失L;L(pji)=-(1-pji)rlog(pji),式中,L(pji)为第j个像素的损失,r为0~4之间的实数;最小化平均损失求解模块,用于求解最小化L,求解得到的最小化L被输出给所述参数设置模块,用于更新所述FCN网络模型中的学习参数;其中,所述FCN网络模型中的学习参数被更新之后,所述图像输入模块再次输入样本图像到更新后的FCN网络模型,所述概率输出模块、损失计算模块、最小化平均损失求解模块重复迭代工作,直至设定的迭代次数;所述图像分割装置还包括类别选择模块,用于从最后一次更新的FCN网络模型输出待分割图像中每个像素为各种类别的概率,并选择概率最大值对应的类别,作为该像素所确定的类别。再一方面,本专利技术实施例同时提供了一种包括计算机可读指令的计算机可读存储介质,所述计算机可读指令在被执行时使处理器执行本专利技术实施例中所述方法中的操作。再一方面,本专利技术实施例同时提供了一种电子设备,包括:存储器,存储程序指令;处理器,与所述存储器相连接,执行存储器中的程序指令,实现本专利技术实施例中所述方法中的步骤。与现有技术相比,本专利技术的有益效果:本专利技术通过对FCN网络模型的损失函数进行改进,提高对图像分类的准确性,实现了利用像素分类的方式准确提提电子文档中的图表信息,通过这些信息就可以对文件中的图表进行重绘,并可以根据这些元素对图表进行检索、分析等处理。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1本专利技术较佳实施例提供的图像分割方法的流程图。图2是本专利技术较佳实施例提供的图像分割装置的功能模块示意图。图3为采用传统图像分割方法分割后还原得到的图像。图4为采用本专利技术实施例中所述图像分割方法分割后还原得到的图像。图5为实施例中提供的一种电子设备的结构示意框图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,本实施例中提供了一种图像分割方法,具体地,包括以下步骤:S201,将一张样本图像输入已初始化的FCN网络模型中,得到当前模型参数下样本图像中每个像素分类的概率pji,pji表示样本图像中第j个像素为第i类的概率。所述初始化是指初始化FCN网络模型中的学习参数,所述学习参数包括卷积层中每层的权重矩阵,作为举例说明,例如权重初始设置为均值为0,方差为0.002的随机数。需要说明的是,针对于不同的应用,像素分类的类别可以不同。例如本实施例中,仅针对于图表图像为例,像素分类的类别可以包括背景、Y轴、X轴、Y轴文字、X轴文字、图例、图例文字、图题文字等。以像素类别包括背景、Y轴、X轴、Y轴文字、X轴文字、图例、图例文字、图题文字这8个类别为例,则有i=0,1,2,3,4,5,6,7。也就是针对于每一个像素,就会得到该像素对应的8个概率值,每个概率值即表示该像素为对应类别的概率大小。另外需要说明的是,本实施例中,仅以图表图像为例进行说明,但是本实施例中所述的FCN网络模型,可以应用于任何图像的分割,包括类别平衡或不平衡的图像,针对于图表图像等类别不平衡的情况,相对于传统方法,提高像素分割准确度的效果更佳明显。S202,利用掩膜图像中的标记对步骤S102中的输出结果进行损失计算。此处的掩膜图像(maskimage)是与图表图像对应的,掩膜图像与图表图像的尺寸一样,掩膜图像中的每个像素表示对应的图表图像中每个像素的所属类别,此处通过0~255的数值表示,如背景标记为0,Y轴标记为1,X轴标记为2,等等,即是说,掩膜图像中每个像素对应标记一个0~255的数值。在生成图表图像后,就对应生成掩膜图像,图表图像和掩膜图像均作为训练样本。具体地,本步骤中,采用如下公式进行损失计算:L(pji)=-(1-pji)rlog(pji),式中,L(pji)为第j个像本文档来自技高网...

【技术保护点】
1.一种图像分割方法,其特征在于,包括以下步骤:步骤A,将一张样本图像输入已初始化的FCN网络模型中,得到当前模型参数下样本图像中每个像素分类的概率pji,pji表示样本图像中第j个像素为第i类的概率;步骤B,采用如下公式对步骤A中的输出结果进行损失计算,并求取一张样本图像中所有像素的平均损失

【技术特征摘要】
1.一种图像分割方法,其特征在于,包括以下步骤:步骤A,将一张样本图像输入已初始化的FCN网络模型中,得到当前模型参数下样本图像中每个像素分类的概率pji,pji表示样本图像中第j个像素为第i类的概率;步骤B,采用如下公式对步骤A中的输出结果进行损失计算,并求取一张样本图像中所有像素的平均损失L(pji)=-(1-pji)rlog(pji),式中,L(pji)为第j个像素的损失,r为0~4之间的实数;步骤C,求解最小化并更新FCN网络模型中所有的学习参数;步骤D,循环执行步骤A~步骤C,直至设定的迭代次数;步骤E,将待分割图像输入最后一次更新的FCN网络模型中,得到待分割图像中每个像素为各种类别的概率,选择概率最大值对应的类别为该个像素图像分割所确定的类别。2.根据权利要求1所述的方法,其特征在于,所述待分割图像为图表图像,像素分类包括背景、Y轴、X轴、Y轴文字、X轴文字、图例、图例文字、图题文字。3.根据权利要求1所述的方法,其特征在于,所述步骤D中,采用反向传播和梯度下降算法求解最小化4.根据权利要求1所述的方法,其特征在于,所述步骤D中所设定的迭代次数的最小值至少应保障所得到的不再下降。5.根据权利要求1所述的方法,其特征在于,在损失函数中,选择r=2。6.一种图像分割装置,其特征在于,包括:FCN网络模型;参数设置模块,用于设置所述FCN网络模型中的学习参数,包括初始化FCN网络模型中的学习参数,以及在...

【专利技术属性】
技术研发人员:余宙杨永智郭萌
申请(专利权)人:阿博茨德北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1