估计对象密度和/或流量的深度学习方法及相关方法和软件技术

技术编号：23028748 阅读：47 留言：0更新日期：2020-01-03 18:16

利用人工神经网络(ANN)估计一个或更多个场景中对象的密度和/或流量(速度)的方法和软件，每个场景在一个或更多个图像中捕获。在一些实施例中，ANN及其训练被配置成提供可靠的估计，尽管存在一个或更多个挑战，这些挑战包括但不限于低分辨率图像、低帧率图像采集、高对象遮挡率、大摄像机视角、大范围变化的照明条件和大范围变化的天气条件。在一些实施例中，在ANN中使用完全卷积网络(FCN)。在一些实施例中，长短期记忆网络(LSTM)与FCN一起使用。在这样的实施例中，LSTM可以以残差学习方式或直接连接方式连接到FCN。还公开了生成用于训练基于ANN的估计算法的训练图像的方法，该方法使得估计算法的训练成本更低。

Deep learning methods for estimating object density and / or traffic and related methods and software

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】估计对象密度和/或流量的深度学习方法及相关方法和软件相关申请数据本申请要求2017年4月5日提交的且题为“ExtractUrbanTrafficInformationFromCitywideInfrastructureSensorstoAugmentAutonomousIntelligentSystem”的序列号为62/601,953的美国临时专利申请的优先权的权益，所述临时专利申请的全部内容以引用的方式并入本文。专利
本专利技术大体上涉及机器/计算机视觉领域。特别地，本专利技术涉及使用机器视觉来估计对象的密度和/或流量的深度学习方法，以及相关的方法和软件。背景随着公共部门中仪器的不断增加和自动化程度的不断提高，数据量也越来越大，人们希望将这些数据用于诸如提高自动化程度、并且更广泛地说提高对决策者可能有用的信息的实时意识的用途。例如，城市越来越多地安装了各种传感器，如磁环检测器、红外传感器、压力垫、路边雷达和网络摄像机。这些传感器中的许多传感器可以提供城市中有关交通流量的相关信息，如车辆速度、计数和类型。特别地，安装在城市街道或城市其他道路的交叉路口的摄像机越来越多，使得能够提取每种类型车辆的交通流量的实时估计，例如黄色出租车的流速。全市范围的网络摄像机全天候连续捕获交通视频，生成大规模的交通视频数据。这些摄像机要么是低质量的，要么它可能只是为了处理它们的视频的低质量版本。这排除了大多数现有的用于交通流量分析的技术。预计无人驾驶车辆将越来越多地出现在城市街道上，并在不久的将来成为交通流量的重要组成...

【技术保护点】
1.一种向智能交通系统提供交通密度和/或交通流量数据的方法，其中，所述交通密度和/或交通流量数据用于道路网络的多个区域，每个区域具有与其相关联的交通摄像机，所述交通摄像机捕获相应区域的至少一个相应交通图像，所述方法包括：/n使用所述至少一个相应交通图像，在每个交通摄像机本地自动估计所述道路网络的相应区域中的交通密度和/或交通流量，对每个相应区域进行估计包括：/n使用训练标注图像来训练基于人工神经网络(ANN)的密度估计算法，其中，所述基于ANN的密度估计算法被配置成在训练时处理一个或更多个输入图像，以自动确定所述输入图像中存在的交通的交通密度和/或交通流量；/n接收所述至少一个相应交通图像；以及/n在所述基于ANN的密度估计算法的训练之后，使所述基于ANN的密度估计算法处理所述至少一个相应交通图像，以确定对于所述相应区域的交通密度和/或交通流量；以及/n从每个交通摄像机本地向所述智能交通系统传输与所述道路网络的相应区域中的所述交通密度和/或交通流量相对应的交通密度和/或交通流量数据。/n

【技术特征摘要】
【国外来华专利技术】20170405 US 62/601,9531.一种向智能交通系统提供交通密度和/或交通流量数据的方法，其中，所述交通密度和/或交通流量数据用于道路网络的多个区域，每个区域具有与其相关联的交通摄像机，所述交通摄像机捕获相应区域的至少一个相应交通图像，所述方法包括：
使用所述至少一个相应交通图像，在每个交通摄像机本地自动估计所述道路网络的相应区域中的交通密度和/或交通流量，对每个相应区域进行估计包括：
使用训练标注图像来训练基于人工神经网络(ANN)的密度估计算法，其中，所述基于ANN的密度估计算法被配置成在训练时处理一个或更多个输入图像，以自动确定所述输入图像中存在的交通的交通密度和/或交通流量；
接收所述至少一个相应交通图像；以及
在所述基于ANN的密度估计算法的训练之后，使所述基于ANN的密度估计算法处理所述至少一个相应交通图像，以确定对于所述相应区域的交通密度和/或交通流量；以及
从每个交通摄像机本地向所述智能交通系统传输与所述道路网络的相应区域中的所述交通密度和/或交通流量相对应的交通密度和/或交通流量数据。

2.根据权利要求1所述的方法，还包括，连同所述交通密度和/或交通流量的传输，传输对于所述道路网络的相应区域的位置信息。

3.根据权利要求1所述的方法，其中，每个交通摄像机具有摄像机视角，所述方法还包括：接收所述训练图像，其中所述训练图像具有与所述交通摄像机的摄像机视角基本相同的训练视角，并且所述训练图像中每一个是包含多个车辆像素级掩模的交通图像，其中所述车辆像素级掩模已经使用分割器被放置在来自所述交通摄像机的交通图像中，所述分割器在已用边界框标注的、来自所述交通摄像机的所述交通图像上操作。

4.根据权利要求3所述的方法，其中，标注的真实图像已由检测器自动标注。

5.根据权利要求3所述的方法，还包括使用从不同类型的不同车辆的3DCAD模型再现的图像来训练所述分割器。

6.根据权利要求1所述的方法，其中，每个交通摄像机具有摄像机视角，所述方法还包括：
接收训练图像，其中，所述训练图像具有与所述交通摄像机的摄像机视角基本相同的训练视角，所述训练图像中每一个是混合图像，所述混合图像具有所述道路的区域的实际背景，并且包含覆盖在所述背景上的不同类型的多个再现车辆，其中所述再现车辆：
基于不同车辆类型的不同车辆的3DCAD模型；
使用基于所述摄像机视角的实际视角和实际遮挡被放置在所述混合图像中；并且
被自动标记用于基于所述3DCAD模型进行归类。

7.根据权利要求1所述的方法，其中，所述基于ANN的估计算法被配置成从交通图像的时序集合中确定交通流量，并且所述方法还包括向所述智能交通系统提供交通流量数据，其中提供所述交通流量数据包括：
接收所述交通图像的时序集合；
使所述基于ANN的密度估计算法处理所述交通图像的集合，以确定对于所述交通图像的集合的交通流量；以及
向所述智能交通系统传输对应于所述交通流量的交通流量数据。

8.根据权利要求1所述的方法，其中，所述基于ANN的估计算法包括完全卷积网络(FCN)。

9.根据权利要求7所述的方法，其中，所述基于ANN的估计算法包括长短期记忆网络(LSTM)。

10.根据权利要求9所述的方法，其中，所述LSTM直接连接到所述FCN。

11.根据权利要求9所述的方法，其中，所述LSTM以残差学习的方式连接到所述FCN。

12.根据权利要求11所述的方法，其中，每个交通摄像机具有摄像机视角，所述方法还包括：接收所述训练图像，其中所述训练图像具有与所述交通摄像机的摄像机视角基本相同的训练视角，并且所述训练图像中的每一个是包含多个车辆像素级掩模的交通图像，其中所述车辆像素级掩模使用分割器被放置在来自所述交通摄像机的交通图像中，所述分割器在用边界框标注的、来自所述交通摄像机的所述交通图像上操作。

13.根据权利要求12所述的方法，其中，标注的真实图像已由检测器自动标注。

14.根据权利要求12所述的方法，还包括使用从不同类型的不同车辆的3DCAD模型再现的图像来训练所述分割器。

15.根据权利要求11所述的方法，其中，每个交通摄像机具有摄像机视角，所述方法还包括：
接收训练图像，其中，所述训练图像具有与所述交通摄像机的摄像机视角基本相同的训练视角，所述训练图像中的每一个是混合图像，所述混合图像具有所述道路的区域的实际背景，并且包含覆盖在所述背景上的不同类型的多个再现车辆，其中所述再现车辆：
基于不同车辆类型的不同车辆的3DCAD模型；
使用基于所述摄像机视角的实际视角和实际遮挡被放置在所述混合图像中。

16.根据权利要求7所述的方法，其中，所述基于ANN的算法还包括连接到所述FCN的多任务网络。

17.一种生成用于基于人工神经网络(ANN)的密度估计算法的训练图像集合的方法，其中，所述基于ANN的密度估计算法用于检测由固定摄像机捕获的场景内的一种或更多种目标类型的对象的密度，所述方法包括：
接收由所述固定摄像机捕获的真实图像的第一集合，其中，每个真实图像包括具有所述目标类型内的类型的至少一个真实对象；
使用基于ANN的检测器处理每个真实图像，以便用相应的各自的第一边界框区域标注每个真实图像内所述一种或更多种目标类型的对象的出现，其中所述处理产生标注的真实图像的集合；以及
使用基于ANN的分割器处理每个标注的真实图像，以便生成相应的像素级背景掩模，所述背景掩模进一步用于生成用于训练的密度图。

18.根据权利要求17所述的方法，其中，生成训练图像的集合还包括将所述场景的在所述边界框区域之外的区域分割为背景。

19.根据权利要求17所述的方法，还包括在处理所述第一集合中的每个真实图像之前训练所述基于ANN的检测器，其中所述基于ANN的检测器的训练包括：
接收由所述固定摄像机捕获的真实图像的第二集合，其中所述第二集合中的每个真实图像包括具有所述目标类型内的类型的至少一个真实对象；
接收对应于真实图像的所述第二集合的手动标记的真实图像的集合，其中，每个手动标记的真实图像包括所述至少一个真实对象，并且还包括用于所述至少一个真实对象中的每一个的手动插入的边界框；以及
使用真实图像的所述第二集合和相应的手动标记的真实图像的集合来训练所述基于ANN的检测器。

20.根据权利要求19所述的方法，其中，每个交通摄像机具有摄像机视角，所述方法还包括：接收所述训练图像，其中所述训练图像具有与所述交通摄像机的摄像机视角基本相同的训练视角，并且所述训练图像中的每一个是包含多个车辆像素级掩模的交通图像，其中所述车辆像素级掩模使用分割器被放置在来自所述交通摄像机的交通图像中，所述分割器在用边界框标注的、来自所述交通摄像机的交通图像上操作。

21.一种估计由摄像机捕获的场景的图像中的不同目标类型的对象的密度的方法，所述方法包括：
接收训练数据集，其中所述训练数据集包括多个合成图像，所述多个合成图像具有与所述摄像机的摄像机视角基本相同的训练视角，所述合成图像中的每一个包含不同类型的多个再现对象，其中所述再现对象：
基于不同类型的不同对象的3DCAD模型；
使用基于所述摄像机视角的实际视角和实际遮挡被放置在所述合成图像中；并且
被自动标记用于基于所述3DCAD模型进行归类；使用所述合成图像来训练基于人工神经网络(ANN)的密度估计算法，其中所述基于ANN的密度估计算法被配置成在训练时处理输入图像以自动估计存...

【专利技术属性】
技术研发人员：何塞·M·F·莫拉，若昂·保罗·科斯泰拉，张商行，叶夫根尼·托罗波夫，
申请(专利权)人：卡内基梅隆大学，里斯本高等理工学院，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人