语义识别方法和装置、电子设备及存储介质制造方法及图纸

技术编号：22565736 阅读：28 留言：0更新日期：2019-11-16 12:18

本公开实施例公开了一种语义识别方法和装置、电子设备及存储介质，其中方法包括：生成第一图像；对所述第一图像进行多种语义层次中每种语义层次上的语义识别处理，得到所述第一图像的多种预测语义；基于所述第一图像的多种预测语义，识别所述第一图像的目标语义，其中，所述目标语义被用于进行语义编辑处理，可以识别生成模型生成图像时的可编辑语义，在原有图像的基础上，获得更多不同层次的语义的图像。

Semantic recognition methods and devices, electronic equipment and storage media

The embodiment of the disclosure discloses a semantic recognition method and device, an electronic device and a storage medium, wherein the method comprises: generating a first image; performing semantic recognition processing on each semantic level of the first image in a plurality of semantic levels to obtain a plurality of prediction semantics of the first image; recognizing the first image based on the plurality of prediction semantics of the first image The target semantics can be used for semantic editing, recognize the editable semantics when generating the image of the model, and obtain more images with different levels of semantics on the basis of the original image.

全部详细技术资料下载

【技术实现步骤摘要】
语义识别方法和装置、电子设备及存储介质
本公开涉及计算机视觉
，具体涉及一种语义识别方法和装置、电子设备及存储介质。
技术介绍
如今随着计算机视觉处理技术的发展，生成模型在图片合成、场景合成中已经取得了重大的突破，能够生成越来越高分辨率和保真度的图像的模型不断提出。在图片合成、场景合成中，提高生成模型的解释性也变得愈发重要。目前依靠生成模型的图像编辑和生成方法往往关注物体本身，只能编辑图像中的某些物体的种类和位置，生成的图像具有局限性。
技术实现思路
本公开实施例提供了一种语义识别方法和装置、电子设备及存储介质。本公开实施例第一方面提供一种语义识别方法，包括：生成第一图像；对所述第一图像进行多种语义层次中每种语义层次上的语义识别处理，得到所述第一图像的多种预测语义；基于所述第一图像的多种预测语义，识别所述第一图像的目标语义，其中，所述目标语义被用于进行语义编辑处理。通过上述步骤，经过多种语义层次上的语义识别，可以识别出第一图像的目标语义，其中，目标语义可以作为可编辑语义，能够支持对第一图像上的目标语义进行编辑操作。这样，可以在原有图像的基础上，通过对目标语义的语义编辑操作，可以有利于获得更多不同语义层次的语义的图像。在一种可选的实施方式中，所述方法还包括：对所述第一图像的目标语义进行语义编辑处理，得到经语义编辑后的第二图像。通过上述步骤可以对目标语义进行语义编辑操作，经语义编辑后的第二图像的语义可以是不同于第一图像的目标语义，从而有助于获得更多...

【技术保护点】
1.一种语义识别方法，其特征在于，所述方法包括：/n生成第一图像；/n对所述第一图像进行多种语义层次中每种语义层次上的语义识别处理，得到所述第一图像的多种预测语义；/n基于所述第一图像的多种预测语义，识别所述第一图像的目标语义，其中，所述目标语义被用于进行语义编辑处理。/n

【技术特征摘要】
1.一种语义识别方法，其特征在于，所述方法包括：
生成第一图像；
对所述第一图像进行多种语义层次中每种语义层次上的语义识别处理，得到所述第一图像的多种预测语义；
基于所述第一图像的多种预测语义，识别所述第一图像的目标语义，其中，所述目标语义被用于进行语义编辑处理。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
对所述第一图像的目标语义进行语义编辑处理，得到经语义编辑后的第二图像。

3.根据权利要求1或2所述的方法，其特征在于，所述生成第一图像，包括：
获取生成模型的潜在空间中的潜在编码；
利用生成模型和所述生成模型中的潜在编码，生成第一图像。

4.根据权利要求3所述的方法，其特征在于，所述获取生成模型的潜在空间中的潜在编码，包括：
获取第三图像并提取所述第三图像的特征向量；
将提取的特征向量映射到所述潜在空间上，作为所述生成模型的潜在空间中的潜在编码。

5.根据权利要求1至4任一所述的方法，其特征在于，所述多种语义层次中的第一语义层次对应有第一语义判别模型；第一语义层次为所述多种语义层次中的任一种；
所述对所述第一图像进行多种语义层次中每种语义层次上的语义识别处理，得到所述第一图像的多种预测语义，包括：
利用所述第一语义判别模型，对所述第一图像进行第一语义层次上的语义识别处理，得到所述第一图像在所述第一语义层次上的预测语义。

6.根据权利要求1至5任一所述的方法，其特征在于，所述多种预测语义中的第一预测语义与生成模型的潜在空间中的潜在编码相对应，所述生成模型和所述潜在编码被用于生成所述第一图像，所述第一预测语义为所述多种预测语义中的任一种；

【专利技术属性】
技术研发人员：杨策元，沈宇军，周博磊，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人