面向移动端虚拟现实与增强现实的场景图谱生成方法技术

技术编号：24123694 阅读：46 留言：0更新日期：2020-05-13 03:53

本发明专利技术提供面向移动端虚拟现实和增强现实的场景图谱生成方法，涉及场景图谱领域。包括：利用场景图谱样本集，提取视觉关系组合、常识信息；通过目标检测模型检测出图像中物体的物体框及其物体类别；获取与物体对应的语义信息，根据常识信息进一步构造常识知识图，生成视觉关系f1；提取物体框区域的视觉信息，生成视觉关系f2；结合常识信息和视觉信息，通过注意力机制将f1、f2结合，生成场景图谱，获得并优化场景图谱生成模型。本发明专利技术在移动端运行场景图谱生成模型，能快速识别虚拟现实或增强现实画面中目标物体及物体之间的关系，相比服务器端检测具有更高的检测效率，为面向移动端虚拟现实和增强现实进行场景图谱生成提供技术可行性。

Scene map generation method for mobile virtual reality and augmented reality

全部详细技术资料下载

【技术实现步骤摘要】
面向移动端虚拟现实与增强现实的场景图谱生成方法
本专利技术涉及场景图谱表示学习相关领域，更具体地，涉及面向移动端虚拟现实与增强现实的场景图谱生成方法。
技术介绍
随着移动设备的普及和其计算能力的提高，在移动设备中虚拟现实与增强现实应用也随之发展。虚拟现实是利用计算机生成的一种模拟环境，使用户沉浸到该环境中。增强现实技术使现实世界信息和虚拟世界信息内容综合在一起，被人类感官所感知，从而实现超越现实的感官体验。为了使虚拟现实和增强现实的系统更好地被人类感知，系统有必要对现实世界进行理解，场景图谱是机器对现实世界图像进行理解的关键步骤。从现实场景对应的场景图谱中抽象出视觉关系，有利于机器对现实场景的理解。图像场景图谱是对一幅图像所描绘场景的抽象的、结构化的表示。具体来说，图像场景图谱以图像场景图谱视觉关系组合(主语物体、关系谓词、宾语物体)的方式记录了图像中的两个物体以及两个物体之间的关系，并且每个物体在图像中都有一个对应的物体框和物体类别。图像场景图谱最先由Johnson等人提出，近来在计算机视觉和人工智能领域受到了关注。其中视觉关系组合对图像理解、图像描述等任务有很大的帮助。以往的场景图谱生成方法，大多是利用图像的视觉信息，没有充分利用到与图像相关的一些常识信息，这些常识信息有利于为我们对图像上物体关系的理解，所以本专利技术提出了一个基于常识知识图的场景图谱生成方法，该方法结合了图像的视觉信息和收集的常识信息进行场景图谱生成。随着神经网络的发展和移动终端的普及，移动终端可以应用一些神经网络模型，...

【技术保护点】
1.面向移动端虚拟现实和增强现实的场景图谱生成方法，其特征在于，包括以下步骤：/nS1、利用场景图谱样本集，提取并统计视觉关系组合，提取常识信息；/nS2、通过训练好的目标检测模型检测出输入场景图谱样本集图像中的物体，生成若干个物体框，并预测出物体框对应的物体类别；/nS3、根据步骤S2得到的物体类别获取与物体对应的语义信息，再根据步骤S1所提取的常识信息，进一步构造常识知识图，生成初步的视觉关系f1；/nS4、通过神经网络模型提取所述物体框的视觉信息，包括视觉特征、空间特征和语义特征，生成初步的视觉关系f2；/nS5、结合视觉信息和常识信息，通过注意力机制，将初步的视觉关系f1、初步的视觉关系f2的检测结果结合，进行场景图谱生成，并得到场景图谱生成模型；/nS6、虚拟现实与增强现实系统包括移动端、计算机显示终端，对得到的场景图谱生成模型进行常识知识图和模型参数的优化，从而获取能够嵌入移动端的模型，以现实场景图像作为输入，并传输给计算及显示终端；计算及显示终端接收到现实场景图像，进行场景图谱生成，抽取对应现实场景图的视觉关系，叠加在现实场景图像中，获得当前现实或虚拟场景的场景图谱。/n

【技术特征摘要】
1.面向移动端虚拟现实和增强现实的场景图谱生成方法，其特征在于，包括以下步骤：
S1、利用场景图谱样本集，提取并统计视觉关系组合，提取常识信息；
S2、通过训练好的目标检测模型检测出输入场景图谱样本集图像中的物体，生成若干个物体框，并预测出物体框对应的物体类别；
S3、根据步骤S2得到的物体类别获取与物体对应的语义信息，再根据步骤S1所提取的常识信息，进一步构造常识知识图，生成初步的视觉关系f1；
S4、通过神经网络模型提取所述物体框的视觉信息，包括视觉特征、空间特征和语义特征，生成初步的视觉关系f2；
S5、结合视觉信息和常识信息，通过注意力机制，将初步的视觉关系f1、初步的视觉关系f2的检测结果结合，进行场景图谱生成，并得到场景图谱生成模型；
S6、虚拟现实与增强现实系统包括移动端、计算机显示终端，对得到的场景图谱生成模型进行常识知识图和模型参数的优化，从而获取能够嵌入移动端的模型，以现实场景图像作为输入，并传输给计算及显示终端；计算及显示终端接收到现实场景图像，进行场景图谱生成，抽取对应现实场景图的视觉关系，叠加在现实场景图像中，获得当前现实或虚拟场景的场景图谱。

2.根据权利要求1所述的面向移动端虚拟现实和增强现实的场景图谱生成方法，其特征在于，步骤S1所利用的场景图谱样本集中，视觉关系组合标记为(s,p,o)，其中s代表主语物体，o代表宾语物体，p代表关系谓词。

3.根据权利要求1所述的面向移动端虚拟现实和增强现实的场景图谱生成方法，其特征在于，步骤S1包括：
S11、将场景图谱样本集进行采样得到样本数据集，作为场景图谱生成方法的输入；
S12、提取样本数据集中的视觉关系组合，对视觉关系组合进行统计，根据样本数据集合里的视觉关系组合提取出常识信息，构建常识知识图其中λ表示标记函数,表示两个物体之间的关系的一个条件概率：

式中，表示两个物体之间的关系，cs、表示物体类别。

4.根据权利要求1所述的面向移动端虚拟现实和增强现实的场景图谱生成方法，其特征在于，步骤S1将场景图谱样本集进行采样得到样本数据集，作...

【专利技术属性】
技术研发人员：万海，欧佳玲，曾娟，王宝亿，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人