使用神经网络进行场景转移的基于对象的预测制造技术

技术编号：39124668 阅读：10 留言：0更新日期：2023-10-23 14:48

方法、计算机系统和设备，包括在计算机存储介质上编码以用于预测场景转移的计算机程序。计算机系统接收场景图像的输入序列，其中每个图像对应于观察时间序列中的不同时间点。对于每个时间点，系统使用分解神经网络处理对应图像以生成一个或多个特征表示。系统使用对准神经网络处理时间点的特征表示以生成一组对准的特征表示序列。系统进一步使用转移神经网络处理所述一组对准的特征表示序列，以针对每个对准的特征表示序列来预测一个或多个特征表示，该特征表示表示由对准序列表示的对象在一个或多个连续时间点处的预测特征。在一个或多个连续时间点处的预测特征。在一个或多个连续时间点处的预测特征。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用神经网络进行场景转移的基于对象的预测
[0001]相关申请的交叉引用
[0002]本申请要求于2021年2月5日提交的美国临时专利申请No.63/146,353的优先权，该申请的公开内容通过引用整体并入全文。

技术介绍

[0003]本说明书涉及使用神经网络来处理图像观察序列。
[0004]神经网络是采用一层或多层非线性单元来预测所接收输入的输出的机器学习模型。一些神经网络包括除了输出层之外的一个或多个隐藏层。每个隐藏层的输出用作网络中的下一层(即下一隐藏层或输出层)的输入。网络的每一层根据相应参数集的当前值从接收到的输入中生成输出。

技术实现思路

[0005]本说明书描述用于使用神经网络来进行场景转移(scene transitioning)的基于对象的预测的方法、计算机系统和设备，其包括在计算机存储介质上编码的计算机程序。
[0006]在一个创新方面，本说明书描述了一种用于预测场景转移的方法。该方法由包括一个或多个计算机的系统实施。该系统接收场景图像的输入序列，其中每个图像对应于观察时间序列中的不同时间点。对于每个时间点，系统使用分解神经网络处理对应图像以生成一个或多个特征表示。每个特征表示均表示一组对象中出现在对应图像中的一个对象。系统使用对准神经网络处理时间点的特征表示以生成一组对准的特征表示序列。每个对准的特征表示序列表示观察时间序列中的不同时间点上的相同对象。系统进一步使用转移神经网络处理所述一组对准的特征表示序列，以针对每个对准的特征表示序列来预测一个或多个特征表示，该一个或多个...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个计算机执行的方法，所述方法包括：接收场景图像的输入序列，每个图像对应于观察时间序列中的不同时间点；对于每个时间点，使用分解神经网络处理对应图像以生成一个或多个特征表示，每个特征表示均表示一组对象中出现在所述对应图像中的一个对象；使用对准神经网络处理所述时间点的所述特征表示以生成一组对准的特征表示序列，其中，每个对准的特征表示序列表示在所述观察时间序列中的所述不同时间点上的相同对象；以及使用转移神经网络处理所述一组对准的特征表示序列，以针对每个所述对准的特征表示序列来预测一个或多个特征表示，所述一个或多个特征表示表示由该对准的序列所表示的所述对象在一个或多个连续时间点处的预测特征。2.根据权利要求1所述的方法，其中，已经联合地训练所述分解神经网络、所述对准神经网络和所述转移神经网络以最小化联合损失。3.根据权利要求2所述的方法，其中，所述联合损失包括无监督分解损失，所述无监督分解损失测量输入图像与基于由所述分解神经网络的解码器重构的对象掩码的重构图像之间的差异。4.根据权利要求1至3中任一项所述的方法，其中：所述一组对准的特征表示序列分别存储在基于槽位的存储区中的一组槽位中。5.根据权利要求4中任一项所述的方法，其中，所述对准网络预测对准输出，所述对准输出定义用于将当前时间点处的当前特征表示分配给所述基于槽位的存储区中的所述一组槽位中的每个槽位的分配。6.根据权利要求5所述的方法，其中，所述对准输出包括邻接矩阵，所述邻接矩阵用于执行所述当前特征表示与所述基于槽位的存储区中的所述一组槽位的对准。7.根据权利要求6所述的方法，进一步包括：通过基于所述当前特征表示和所述邻接矩阵生成置换矩阵来执行硬对准。8.根据权利要求7所述的方法，其中，使用匈牙利算法来执行所述硬对准。9.根据权利要求7或8所述的方法，其中：通过对从所述图像的输入序列生成的所述特征表示执行所述硬对准来生成所述一组对准的特征表示序列。10.根据权利要求7至9中任一项所述的方法，其中，所述联合损失包括无监督对准损失，所述无监督对准损失包括重构损失，所述重构损失测量基于对准的历史特征表示的所述当前时间点的所述转移神经网络的输出与通过将所述邻接矩阵应用于一组当前特征表示生成的对准的当前特征表示之间的差异。11.根据权利要求10所述的方法，其中，通过执行将所述邻接矩阵与当前特征表示相乘的软对准来生成所述一组对准的当前特征表示。12.根据权利要求10或11中任一项所述的方法，其中，所述无监督对准损失进一步包括所...

【专利技术属性】
技术研发人员：安东尼亚，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人