【技术实现步骤摘要】
交互式图像分割方法、系统、设备及存储介质
[0001]本申请涉及计算机视觉
,尤其涉及一种交互式图像分割方法、系统、设备及存储介质。
技术介绍
[0002]实例分割在图像相关的应用领域有着广泛的运用。实例分割是指,从图像中分割出特定的实例,并输出特定实例的蒙板(mask)。例如,从图像中斑马群中分割出其中一只斑马对应的局部图像,并输出该斑马的局部图像的蒙版。
[0003]但是,现有的实例分割方法的分割结果的可靠性较差。因此,有待提出一种新的解决方案。
技术实现思路
[0004]本申请的多个方面提供一种交互式图像分割方法、系统、设备及存储介质,用以提升图像第一实例的预测蒙版的可靠性。
[0005]本申请实施例提供一种交互式图像分割系统,包括:终端设备以及服务器;其中,所述终端设备,用于:展示第一图像以及第一蒙版;响应用户在所述第一图像上绘制实例分割引导轴的操作,确定所述实例分割引导轴对应的第一引导图,并将所述第一图像和所述第一引导图发送至所述服务器;以及,接收所述服务器返回的与所述实例分割 ...
【技术保护点】
【技术特征摘要】
1.一种交互式图像分割系统,其特征在于,包括:终端设备以及服务器;其中,所述终端设备,用于:展示第一图像以及第一蒙版;响应用户在所述第一图像上绘制实例分割引导轴的操作,确定所述实例分割引导轴对应的第一引导图,并将所述第一图像和所述第一引导图发送至所述服务器;以及,接收所述服务器返回的与所述实例分割引导轴对应的第二蒙版,并在所述第一图像上突出展示所述第二蒙版对应的局部图像区域;所述服务器,用于:接收所述终端设备发送的第一图像以及第一引导图;将所述第一图像、所述第一蒙版以及所述第一引导图输入神经网络模型,所述神经网络模型根据模拟用户的分割引导交互操作生成的引导图样本训练得到;在所述神经网络模型中,提取所述第一图像和所述第一引导图的语义特征;根据所述语义特征预测所述实例分割引导轴对应的第二蒙版,并将预测得到的所述第二蒙版返回至所述终端设备。2.一种交互式图像分割方法,其特征在于,包括:展示第一图像以及第一蒙版;响应用户在所述第一图像上绘制实例分割引导轴的操作,确定所述实例分割引导轴对应的第一引导图;将所述第一图像、所述第一蒙版以及所述第一引导图输入神经网络模型,所述神经网络模型根据模拟用户的分割引导交互操作生成的引导图样本训练得到;在所述神经网络模型中,提取所述第一图像和所述第一引导图的语义特征,并根据所述语义特征预测所述实例分割引导轴对应的第二蒙版;在所述第一图像上突出展示所述第二蒙版对应的局部图像区域。3.一种交互式图像分割方法,适用于终端设备,其特征在于,包括:展示第一图像以及第一蒙版;响应用户在所述第一图像上绘制实例分割引导轴的操作,确定所述实例分割引导轴对应的第一引导图;将所述第一图像、所述第一蒙版以及所述第一引导图发送至服务器,以使所述服务器采用神经网络模型预测所述实例分割引导轴对应的第二蒙版;接收所述服务器返回的所述第二蒙版,并在所述第一图像上突出展示所述第二蒙版对应的局部图像区域。4.一种交互式图像分割方法,适用于服务器,其特征在于,包括:接收终端设备发送的第一图像、第一蒙版以及第一引导图,所述第一引导图根据用户在所述第一图像上绘制的实例分割引导轴生成;将所述第一图像、所述第一蒙版以及所述第一引导图输入神经网络模型,所述神经网络模型根据模拟用户的分割引导交互操作生成的引导图样本训练得到;在所述神经网络模型中,提取所述第一图像和所述第一引导图的语义特征,并根据所述语义特征预测所述实例分割引导轴对应的第二蒙版;将预测得到的所述第二蒙版返回至所述终端设备进行展示。5.根据权利要求4所述的方法,其特征在于,还包括:获取样本图像以及所述样本图像中的实例样本的真实蒙版;
模拟用户的多轮分割引导交互操作,在每轮交互操作中,根据所述实例样本的真实蒙版以及每轮交互操作输入的预测蒙版,模拟用户在所述样本图像上绘制实例分割引导轴的操作,以得到多个引导图样本;根据所述样本图像、所述真实蒙版、所述多个引导图样本以及所述每轮操作交互操作输入的预测蒙版,得到所述多轮交互操作各自对应的训练数据;根据所述多轮交互操作各自对应的训练数据对神经网络模型进行训练,以在所述真实蒙版的监督下,对所述神经网络模型的参数进行优化。6.根据权利要求5所述的方法,其特征在,还包括:在模拟第i轮的交互操作时,将所述样本图像、所述第i轮的交互操作生成的引导图以及所述第i轮的交互操作输入的预测蒙版作为设定的蒙版预测算法的入参,计算得到第i轮的交互操作...
【专利技术属性】
技术研发人员:梁缘,任沛然,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。