【技术实现步骤摘要】
一种空间对象布局生成方法、装置、设备及存储介质
[0001]本公开实施例涉及人工智能技术,尤其涉及一种空间对象布局生成方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]目前,可以通过从全景图像中识别出空间对象布局,并根据空间对象布局实现整体场景理解,进而,实现增强现实和虚拟现实应用
。
[0003]然而,相关识别方案主要是在无遮挡或者仅有少量物体的简单场景中,实现空间对象布局识别
。
对于放置有较多物体的复杂场景,在采用相关识别方案生成空间对象布局时,往往会错过布局边界和角落,导致对于复杂场景存在空间对象布局生成错误,甚至可能无法生成空间对象布局的情况
。
技术实现思路
[0004]本公开实施例提供一种空间对象布局生成方法
、
装置
、
设备及存储介质,可以解决目前无法准确生成空间对象布局的问题
。
[0005]第一方面,本公开实施例提供了一种空间对象布局生成方法,包括: ...
【技术保护点】
【技术特征摘要】
1.
一种空间对象布局生成方法,其特征在于,包括:获取目标图像;将所述目标图像输入预先训练的布局生成模型,通过所述布局生成模型识别所述目标图像中的空间特征,并根据所述空间特征生成所述目标图像对应的空间对象布局;其中,采用空间特征识别模型的设定数量的目标网络层指导所述布局生成模型对应网络层的训练;所述空间特征识别模型为基于历史图像样本和布局语义图样本训练的神经网络模型,所述历史图像样本中具有空间对象布局标注信息,所述布局语义图表征所述历史图像样本中空间对象的结构信息
。2.
根据权利要求1所述的方法,其特征在于,所述空间对象布局标注信息包括所述历史图像样本中的空间对象轮廓坐标和三个互不平行的墙面的交点坐标
。3.
根据权利要求1所述的方法,其特征在于,所述通过所述布局生成模型识别所述目标图像中的空间特征,并根据所述空间特征生成所述目标图像对应的空间对象布局,包括:通过所述布局生成模型对所述目标图像进行编码,得到布局特征和结构特征;对所述布局特征和结构特征进行压缩,得到压缩特征;对所述压缩特征进行解码后,得到解码特征,并根据所述解码特征进行预测,得到所述目标图像对应的空间对象特征,根据所述空间对象特征生成所述目标图像对应的空间对象布局
。4.
根据权利要求1所述的方法,其特征在于,采用如下方式训练所述布局生成模型,包括:根据所述历史图像样本对待训练的布局生成模型进行训练;获取所述空间特征识别模型的每一个目标网络层对应的模型特征;对于所述空间特征识别模型的每一个目标网络层,采用所述目标网络层对应的模型特征指导所述待训练的布局生成模型的对应网络层的训练
。5.
根据权利要求4所述的方法,其特征在于,所述根据所述历史图像样本对待训练的布局生成模型进行训练,包括:将所述历史图像样本输入所述待训练的布局生成模型;获取所述待训练的布局生成模型输出的空间对象布局图和布局语义图,根据所述空间对象布局图和布局语义图指导布局生成模型的训练
。6.
根据权利要求5所述的方法,其特征在于,所述根据所述空间对象布局图和布局语义图指导布局生成模型的训练,包括:根据所述布局语义图与历史图像样本对应的布局语义图样本,确定布局语义损失函数;根据所述空间对象布局图中的第一特征...
【专利技术属性】
技术研发人员:曾志良,傅志荣,李贤芝,高文昭,焦少慧,
申请(专利权)人:抖音视界有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。