建立语义图像分割的个性化知识库的方法及系统技术方案

技术编号：18444983 阅读：28 留言：0更新日期：2018-07-14 10:24

本发明专利技术公开了一种建立语义图像分割的个性化知识库的方法及系统，所述方法包括：从用户中获得查询图像；执行一交互式分割处理以确定所述查询图像中一感兴趣对象的至少一个轮廓；确定在地图图像中与所述感兴趣对象的至少一个轮廓有最大重叠区域的路线；生成一输出图像，所述输出图像包括所述感兴趣对象和与所述感兴趣对象的所述轮廓有最大重叠区域的路线；及将所述输出图像推荐给所述用户，并在一社交网络平台上共享所述输出图像。

Method and system for building personalized knowledge base of semantic image segmentation

The present invention discloses a method and system for establishing a personalized knowledge base of semantic image segmentation. The method includes: obtaining a query image from a user, executing an interactive segmentation process to determine at least one of the contours of an interested object in the query image, and determining the object of interest in the map image. At least one line has the maximum overlap area; an output image is generated, the output image includes the route of the maximum overlap area between the interested object and the described contours of the interested object; and recommends the output image to the user and shares the output image on a social network platform.

全部详细技术资料下载

【技术实现步骤摘要】
建立语义图像分割的个性化知识库的方法及系统
本专利技术涉及计算机视觉
，尤其涉及通过条件随机场来建立语义图像分割的个性化知识库的方法及系统。
技术介绍
语义图像分割是一种将图像分成有意义、无重叠区域的像素级标签任务。在复杂的图像中，图像分割是否有意义取决于用户的意图，即，用户到底要想从图像中获得什么。如果可能，正如人们期望的那样，设计一种通用的方法来尽可能准确地分割图像，这是非常具有挑战性的。这会产生高度不适定的问题，因此用户交互是必不可少的，从而增加了用户的交互工作量。最新的技术方法公开了利用深度学习技术进行图像识别，从而，处理像素级标签任务。这种技术方法的一个核心问题是深度学习技术描绘视觉对象的能力有限，这样通常会导致语义分割任务中出现边界模糊和斑点。卷积神经网络(CNN)无法提供促进相似像素之间标签一致性以及标签输出空间表征连续性的平滑约束。通过建立密集条件随机场(CRF)的平均场近似推理，可将平滑约束纳入循环神经网络(RNN)，这样在训练间将误差导数反向传播到所述CNN时，可优化前一步运算中传统循环神经网络的粗糙输出。然而，在不考虑任何用户交互的情况下，这样的深度神经网络(DNN)大多能完善基准数据库。本专利技术所公开的方法和系统旨在解决上述至少一个问题以及其他问题。
技术实现思路
本专利技术公开的实施例一方面提供了一种建立语义图像分割的个性化知识库的方法。所述方法包括：从用户中获得查询图像；执行一交互式分割处理以确定所述查询图像中一感兴趣对象的至少一个轮廓；确定在地图图像上与所述感兴趣对象的至少一个轮廓有最大重叠区域的路线；生成输出图像，所述输...

【技术保护点】
1.一种建立语义图像分割的个性化知识库的方法，其特征在于，包括以下步骤：从用户中获得查询图像；执行交互式分割处理以确定所述查询图像中感兴趣对象的至少一个轮廓；确定在地图图像上与所述感兴趣对象的至少一个轮廓有最大重叠区域的路线；生成输出图像，所述输出图像包括所述感兴趣对象和与所述感兴趣对象的至少一个轮廓有最大重叠区域的所述路线；将所述输出图像推荐给所述用户，并在社交网络平台上共享所述输出图像。

【技术特征摘要】
2017.01.06 US 15/400,2331.一种建立语义图像分割的个性化知识库的方法，其特征在于，包括以下步骤：从用户中获得查询图像；执行交互式分割处理以确定所述查询图像中感兴趣对象的至少一个轮廓；确定在地图图像上与所述感兴趣对象的至少一个轮廓有最大重叠区域的路线；生成输出图像，所述输出图像包括所述感兴趣对象和与所述感兴趣对象的至少一个轮廓有最大重叠区域的所述路线；将所述输出图像推荐给所述用户，并在社交网络平台上共享所述输出图像。2.根据权利要求1所述的建立语义图像分割的个性化知识库的方法，其特征在于，所述执行交互式分割处理以确定所述查询图像中感兴趣对象的至少一个轮廓，还包括：基于个性化知识库，通过全连接卷积网络和用来推理隐藏单元条件随机场的卷积神经网络信息估计器以连接所述查询图像；持续性反向传播带有更新的地面实况的误差导数，所述更新的地面实况由未知图像的不满意分割结果所触发；以及优化语义分割并学习超像素筛选标准，以构建所述个性化知识库。3.根据权利要求2所述的建立语义图像分割的个性化知识库的方法，其特征在于：给定一组观测值x和参数θ，分割标签s的条件可能性公式建模如下：其中所述参数θ最大化估计为:且边缘分布的计算如下：其中，Zn是一个正规化子:4.一种建立语义图像分割的个性化知识库的系统，其特征在于，包括：交互式分割模块，用于从用户中获得查询图像，并执行交互式分割处理以确定所述查询图像中感兴趣对象的至少一个轮廓；路线搜索模块，用于确定在地图图像上与所述感兴趣对象的至少一个轮廓有最大重叠区域的路线；以及路线推荐模块，用于生成输出图像，所述输出图像包括所述感兴趣对象和与所述感兴趣对象的至少一个轮廓有最大重叠区域的所述路线；及将所述输出图像推荐给所述用户，并在社交网络平台上共享所述输出图像。5.根据权利要求4所述的建立语义图像分割的个性化知识库的系统，其特征在于，所述交互式分割模块包括：图像筛选单元，用于允许所述用户筛选所述查询图像；图像编辑单元，用于允许所述用户通过提供前景与背景限制，编辑与所述查询图像重叠的超像素轮廓；图像处理单元，用于通过所述语义图像分割，处理所述查询图像，以生成至少一...

【专利技术属性】
技术研发人员：廖鑫鹏，任小波，汪灏泓，
申请(专利权)人：TCL集团股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人