【技术实现步骤摘要】
本专利技术属于计算机视觉领域,涉及一种局部实体关系编码的场景图生成方法。
技术介绍
1、人工智能技术的飞速发展促进了计算机视觉和自然语言处理领域的创新。其中,场景图生成是计算机视觉领域中的一个重要任务,其目标在于通过推断图像中存在的目标及其相互关系,生成以节点和边为基本元素的图形式表达,从而获得对图像场景的深入理解。通过对场景中不同物体的视觉理解以及不同物体之间的关系建模,生成的场景图可以服务于自动驾驶、视觉问答、图像描述生成等高级视觉推理任务。
2、近年来,场景图生成模型在实际应用中仍然存在很大的局限性。在复杂的视觉场景中,细微的局部特征和实体之间的微妙交互往往包含关键信息,但这些信息在传统的实体检测和场景图生成方法中容易被忽略。这是因为传统的场景图生成方法一般使用全局实体关系编码方式来学习场景中的实体表示以及谓词表示,这种方法在关系编码过程中会丢失局部的实体个体信息以及局部的实体交互信息,导致在最终场景图生成效果上丢失场景中的局部关键信息。此外,尽管有多种方法如使用深度图和知识图等额外线索来增强场景图生成的效果,但这会造
...【技术保护点】
1.一种局部实体关系编码的场景图生成方法,其特征在于:所述方法包括:
2.根据权利要求1所述的一种局部实体关系编码的场景图生成方法,其特征在于:在步骤S1中,对于给定的图像I,场景图生成的任务为创建一个摘要图以充分展现场景中存在的实体信息以及实体交互信息,包括检测到I内所有实体表示,即再对每个实体对(ei,ej)的谓词ωi→j进行预测,最后使用三元组(ei,ωi→j,ej)构建场景图
3.根据权利要求2所述的一种局部实体关系编码的场景图生成方法,其特征在于:在步骤S2中,针对RGB特征提取,使用预训练的RGB特征提取器提取场景图像I的RGB特征
...【技术特征摘要】
1.一种局部实体关系编码的场景图生成方法,其特征在于:所述方法包括:
2.根据权利要求1所述的一种局部实体关系编码的场景图生成方法,其特征在于:在步骤s1中,对于给定的图像i,场景图生成的任务为创建一个摘要图以充分展现场景中存在的实体信息以及实体交互信息,包括检测到i内所有实体表示,即再对每个实体对(ei,ej)的谓词ωi→j进行预测,最后使用三元组(ei,ωi→j,ej)构建场景图
3.根据权利要求2所述的一种局部实体关系编码的场景图生成方法,其特征在于:在步骤s2中,针对rgb特征提取,使用预训练的rgb特征提取器提取场景图像i的rgb特征;针对深度特征的提取,利用深度图预测模型将输入的rgb图像i转化为深度图像d,并初始训练深度特征提取网络,使用adam在完全基于深度的关系检测任务上进行训练,最后利用深度图像d以及训练的特征提取网络提取深度特征。
4.根据...
【专利技术属性】
技术研发人员:胡敏,赵世洋,黄宏程,孙培博,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。