图像分割模型的训练及图像分割方法、装置、设备和介质制造方法及图纸

技术编号：37332665 阅读：14 留言：0更新日期：2023-04-21 23:10

本公开提供了一种图像分割模型的训练及图像分割方法、装置、设备和介质，涉及人工智能技术领域，具体为深度学习、图像处理、计算机视觉技术领域，可应用于OCR文字识别场景。具体实现方案为：对样本图像进行前景轮廓检测，并根据检测结果确定所述样本图像中的背景区域、前景区域以及所述前景区域的轮廓区域；获取分别对所述背景区域、所述前景区域以及所述轮廓区域中像素点进行标注的标准像素类型，并根据所述样本图像以及所述标准像素类型，对待训练模型进行训练生成图像分割模型。本公开实现了提高图像分割模型进行图像分割时的分割精准度的效果。的效果。的效果。

全部详细技术资料下载

【技术实现步骤摘要】
图像分割模型的训练及图像分割方法、装置、设备和介质

[0001]本公开涉及人工智能
，具体为深度学习、图像处理、计算机视觉
，可应用于OCR文字识别场景，特别涉及一种图像分割模型的训练及图像分割方法、装置、设备和介质。

技术介绍

[0002]图像分割是图像处理与计算机视觉中极为重要的一种分析图像的方法，它的目的是找到图像中所需目标物体(前景)的具体位置，从而可以对目标物体的属性进行测量，例如面积、直径或形状等属性。

技术实现思路

[0003]本公开提供了一种用于提高图像分割精准度的图像分割模型的训练及图像分割方法、装置、设备和介质。
[0004]根据本公开的一方面，提供了一种图像分割模型的训练方法，包括：
[0005]对样本图像进行前景轮廓检测，并根据检测结果确定所述样本图像中的背景区域、前景区域以及所述前景区域的轮廓区域；
[0006]获取分别对所述背景区域、所述前景区域以及所述轮廓区域中像素点进行标注的标准像素类型，并根据所述样本图像以及所述标准像素类型，对待训练模型进行训练生成图像分割模型。
[0007]根据本公开的另一方面，提供了一种图像分割方法，包括：
[0008]获取待分割图像；
[0009]将所述待分割图像输入至图像分割模型中，并根据所述图像分割模型的输出结果，确定所述待分割图像中的背景区域、前景区域以及所述前景区域的轮廓区域；
[0010]其中，所述图像分割模型采用如本公开所提供的图像分割模型的训练方法训练得到。/>[0011]根据本公开的另一方面，提供了一种图像分割模型的训练装置，包括：
[0012]图像区域确定模块，用于对样本图像进行前景轮廓检测，并根据检测结果确定所述样本图像中的背景区域、前景区域以及所述前景区域的轮廓区域；
[0013]模型训练模块，用于获取分别对所述背景区域、所述前景区域以及所述轮廓区域中像素点进行标注的标准像素类型，并根据所述样本图像以及所述标准像素类型，对待训练模型进行训练生成图像分割模型。
[0014]根据本公开的另一方面，提供了一种图像分割装置，包括：
[0015]图像获取模块，用于获取待分割图像；
[0016]图像分割模块，用于将所述待分割图像输入至图像分割模型中，并根据所述图像分割模型的输出结果，确定所述待分割图像中的背景区域、前景区域以及所述前景区域的轮廓区域；
[0017]其中，所述图像分割模型采用如本公开所提供的图像分割模型的训练方法训练得到。
[0018]根据本公开的另一方面，提供了一种电子设备，包括：
[0019]至少一个处理器；以及
[0020]与至少一个处理器通信连接的存储器；其中，
[0021]存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本公开中任一项的方法。
[0022]根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行本公开中任一项的方法。
[0023]根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行本公开中任一项的方法。
[0024]应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0025]附图用于更好地理解本方案，不构成对本公开的限定。其中：
[0026]图1A是根据本公开实施例公开的一些图像分割模型的训练方法的流程图；
[0027]图1B是根据本公开实施例公开的一些图像区域的示意图；
[0028]图2是根据本公开实施例公开的另一些图像分割模型的训练方法的流程图；
[0029]图3是根据本公开实施例公开的一些图像分割方法的流程图；
[0030]图4是根据本公开实施例公开的一些图像分割模型的训练装置的结构示意图；
[0031]图5是根据本公开实施例公开的一些图像分割装置的结构示意图；
[0032]图6是用来实现本公开实施例公开的图像分割模型的训练方法和/或图像分割方法的电子设备的框图。
具体实施方式
[0033]以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
[0034]目前具有众多的方法能够实现图像分割，其中，基于图像分割模型的方法就是这众多方法中的一种。
[0035]现有技术在图像分割模型的训练过程中，通常是对样本图像进行二分类标注，即在样本图像中对于“前景区域”和“背景区域”中的像素点进行标注。
[0036]然而，通过这种训练方式训练得到的图像分割模型虽然也具备图像分割能力，但是由于训练过程中仅对样本图像中“前景区域”和“背景区域”中的像素点进行标注，这就使得图像分割模型缺乏对于“前景区域”的轮廓区域的识别能力，从而导致“前景区域”的分割效果较差，也间接导致“背景区域”的分割效果检查，造成图像分割的精准度较低的问题。
[0037]图1A是根据本公开实施例公开的一些图像分割模型的训练方法的流程图，本实施
例可以适用于训练生成图像分割模型的情况。本实施例方法可以由本公开实施例公开的图像分割模型的训练装置来执行，所述装置可采用软件和/或硬件实现，并可集成在任意的具有计算能力的电子设备上。
[0038]如图1A所示，本实施例公开的图像分割模型的训练方法可以包括：
[0039]S101、对样本图像进行前景轮廓检测，并根据检测结果确定样本图像中的背景区域、前景区域以及前景区域的轮廓区域。
[0040]其中，样本图像表示训练图像分割模型所需的训练图像数据集，样本图像可以从公开的训练图像数据库中获取得到，也可以从本地端存储的图像中获取得到，还可以采用信息爬取技术从互联网的图像库中获取得到等，本实施例并不对样本图像的获取方式进行限定。样本图像的图像格式包括但不限于JEPG格式、TIFF格式、RAW格式、BMP格式和PNG中的一种或多种。
[0041]前景区域表示样本图像中主体实体所覆盖的图像区域，例如假设样本图像中一张检查单为主体实体，则该检查单所覆盖的图像区域即为前景区域。背景区域则表示样本图像中除主体实体外的其他实体所覆盖的图像区域。前景区域的轮廓区域则表示前景区域与背景区域之间的连接区域，也即根据样本图像中主体实体的实体轮廓线所确定的图像区域。
[0042]在一种实施方式中，获取样本图像，并采用预设的轮廓检测算法对样本图像的前景区域进行前景轮廓检测，确定前景区域的前景轮廓线，例如包括但不限于通过调用OpenCV函数的方式对样本图像本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像分割模型的训练方法，包括：对样本图像进行前景轮廓检测，并根据检测结果确定所述样本图像中的背景区域、前景区域以及所述前景区域的轮廓区域；获取分别对所述背景区域、所述前景区域以及所述轮廓区域中像素点进行标注的标准像素类型，并根据所述样本图像以及所述标准像素类型，对待训练模型进行训练生成图像分割模型。2.根据权利要求1所述的方法，其中，所述根据检测结果确定所述样本图像中的背景区域、前景区域以及所述前景区域的轮廓区域，包括：根据检测结果确定前景轮廓线，并根据所述前景轮廓线确定所述轮廓区域；将所述轮廓区域所围成的图像区域作为所述前景区域，且将除所述轮廓区域以及所述前景区域以外的图像区域，作为所述背景区域。3.根据权利要求2所述的方法，其中，所述根据所述前景轮廓线确定所述轮廓区域，包括：按照第一距离值对所述前景轮廓线进行外扩处理，确定外扩轮廓线，且按照第二距离值对所述前景轮廓线进行内缩处理，确定内缩轮廓线；将所述外扩轮廓线和所述内缩轮廓线之间的图像区域作为所述轮廓区域。4.根据权利要求1所述的方法，其中，所述根据所述样本图像以及所述标准像素类型，对待训练模型进行训练生成图像分割模型，包括：将所述样本图像输入至所述待训练模型中，并根据所述待训练模型的输出结果，确定所述样本图像中像素点对应的预测像素类型；根据所述预测像素类型以及所述标准像素类型确定损失总值，并根据所述损失总值对所述待训练模型进行训练生成图像分割模型。5.根据权利要求4所述的方法，其中，所述根据所述预测像素类型以及所述标准像素类型确定损失总值，包括：根据第一类像素点对应的第一预测像素类型和第一标准像素类型，确定第一损失值；根据第二类像素点对应的第二预测像素类型和第二标准像素类型，确定第二损失值；根据第三类像素点对应的第三预测像素类型和第三标准像素类型，确定第三损失值；根据所述第一损失值、所述第二损失值和所述第三损失值确定所述损失总值；其中，所述第一类像素点为属于所述背景区域的像素点，所述第二类像素点为属于所述前景区域的像素点，所述第三类像素点为属于所述轮廓区域的像素点。6.根据权利要求5所述的方法，其中，所述根据所述第一损失值、所述第二损失值和所述第三损失值确定所述损失总值，包括：获取所述第一类像素点对应的第一权重、所述第二类像素点对应的第二权重以及所述第三类像素点对应的第三权重；根据所述第一权重、所述第二权重和所述第三权重，对所述第一损失值、所述第二损失值以及所述第三损失值进行加权求和，确定所述损失总值；其中，所述第三权重小于所述第一权重和所述第二权重。7.一种图像分割方法，包括：获取待分割图像；
将所述待分割图像输入至图像分割模型中，并根据所述图像分割模型的输出结果，确定所述待分割图像中的背景区域、前景区域以及所述前景区域的轮廓区域；其中，所述图像分割模型采用如权利要求1
‑
6中任一所述的图像分割模型的训练方法训练得到。8.一种图像分割模型的训练装置，包括：图像区域确定模块，用于对样本图像进行前景轮廓检测，并根据检测结果确定所述样本图像中的背景区域、前景区域以及所述前景区域的轮廓区域；模型训练模块，用于获取分别对所述背景区域、所述前景区域以及所述轮...

【专利技术属性】
技术研发人员：陈毅，徐杨柳，谢群义，钦夏孟，姚锟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人