图像分割方法及装置制造方法及图纸

技术编号：18555076 阅读：120 留言：0更新日期：2018-07-28 11:40

本发明专利技术涉及一种图像分割方法及装置，所述图像分割方法包括步骤：深度学习以得到FCN网络模型，且在深度学习过程中，使用L(pji)＝‑(1‑pji)rlog(pji)进行损失计算；将待分割图像输入最后一次更新的FCN网络模型中，得到待分割图像中每个像素为各种类别的概率，选择概率最大值对应的类别为该个像素图像分割所确定的类别。本发明专利技术通过对FCN网络模型的损失函数进行改进，提高对图像分类的准确性，实现了利用像素分类的方式准确提提电子文档中的图表信息。

全部详细技术资料下载

【技术实现步骤摘要】
图像分割方法及装置
本专利技术涉及数据处理
，特别涉及一种基于FCN网络模型的图像分割方法及装置。
技术介绍
用于图像分割的深度学习网络包括了U-NET、SEGNET等FCN(全卷积网络)网络，此类网络在一些自然场景的可以实现像素语意分割。目前已有的基于深度学习的分割模型中，最终的像素分类均是按照一般的分类模型(交叉熵)损失定义的。一般情况下，分类模型要求各类别样本数量尽量均等，若存在某个或某些类别下的样本数量远大于另一些类别下的样本数量，即类别不平衡，学习效果一般不甚理想。例如在chart图像中，背景像素占了绝大多数的面积，而title的文字仅占极小的比例，出现了类别极不平衡的状态，如采用标准的多分类交叉熵损失函数进行分类，分类模型更倾向将所有的像素均分类成背景，导致像素分割不准确。
技术实现思路
本专利技术的目的在于改善现有技术中所存在的类别不平衡时像素分割不准确的不足，提供一种可以提高像素分割准确性的图像分割方法及装置。为了实现上述专利技术目的，本专利技术实施例提供了以下技术方案：一方面，本专利技术实施例中提供了一种图像分割方法，包括以下步骤：步骤A，将一张样本图像输入已初始化的FCN网络模型中，得到当前模型参数下样本图像中每个像素分类的概率pji，pji表示样本图像中第j个像素为第i类的概率；步骤B，采用如下公式对步骤A中的输出结果进行损失计算，并求取一张样本图像中所有像素的平均损失L(pji)＝-(1-pji)rlog(pji)，式中，L(pji)为第j个像素的损失，r为0～4之间的实数；步骤C，求解最小化并更新FCN网络模型中所有的学习参数；...

【技术保护点】
1.一种图像分割方法，其特征在于，包括以下步骤：步骤A，将一张样本图像输入已初始化的FCN网络模型中，得到当前模型参数下样本图像中每个像素分类的概率pji，pji表示样本图像中第j个像素为第i类的概率；步骤B，采用如下公式对步骤A中的输出结果进行损失计算，并求取一张样本图像中所有像素的平均损失

【技术特征摘要】
1.一种图像分割方法，其特征在于，包括以下步骤：步骤A，将一张样本图像输入已初始化的FCN网络模型中，得到当前模型参数下样本图像中每个像素分类的概率pji，pji表示样本图像中第j个像素为第i类的概率；步骤B，采用如下公式对步骤A中的输出结果进行损失计算，并求取一张样本图像中所有像素的平均损失L(pji)＝-(1-pji)rlog(pji)，式中，L(pji)为第j个像素的损失，r为0～4之间的实数；步骤C，求解最小化并更新FCN网络模型中所有的学习参数；步骤D，循环执行步骤A～步骤C，直至设定的迭代次数；步骤E，将待分割图像输入最后一次更新的FCN网络模型中，得到待分割图像中每个像素为各种类别的概率，选择概率最大值对应的类别为该个像素图像分割所确定的类别。2.根据权利要求1所述的方法，其特征在于，所述待分割图像为图表图像，像素分类包括背景、Y轴、X轴、Y轴文字、X轴文字、图例、图例文字、图题文字。3.根据权利要求1所述的方法，其特征在于，所述步骤D中，采用反向传播和梯度下降算法求解最小化4.根据权利要求1所述的方法，其特征在于，所述步骤D中所设定的迭代次数的最小值至少应保障所得到的不再下降。5.根据权利要求1所述的方法，其特征在于，在损失函数中，选择r＝2。6.一种图像分割装置，其特征在于，包括：FCN网络模型；参数设置模块，用于设置所述FCN网络模型中的学习参数，包括初始化FCN网络模型中的学习参数，以及在...

【专利技术属性】
技术研发人员：余宙，杨永智，郭萌，
申请(专利权)人：阿博茨德北京科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人