一种用于无人售货柜的多角度视频融合的商品识别算法制造技术

技术编号：19693568 阅读：23 留言：0更新日期：2018-12-08 11:37

本发明专利技术提供一种用于无人售货柜的多角度视频融合的商品识别算法，包括以下步骤：对采集到的视频数据进行预处理；对所述视频数据中视频帧进行关键帧采样；构建深度卷积神经网络模型；利用采样的关键帧对所述模型进行训练和精度测试，在商品识别的精度达到预期后，部署所述模型，进一步包括：特征提取、特征融合、特征识别；来自无人售货柜的不同角度摄像头的视频数据经预处理和关键帧采样后输入所述模型，得到识别出的商品种类和对应的商品数量。本发明专利技术通过多角度视频融合技术，充分利用多源数据带来的丰富信息来降低商品被遮挡的影响，从而提高商品识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于无人售货柜的多角度视频融合的商品识别算法
本专利技术涉及无人售货柜
，具体涉及一种用于无人售货柜的多角度视频融合的商品识别算法。
技术介绍
随着人工智能技术的发展，各行各业都开始应用人工智能技术来降低行业运行成本并提高其效率，尤其在新零售领域，如何利用人工智能技术来降低运营成本并让商品触手可及，便成为了行业里的热点研究领域。随着近几年科研人员在计算机视觉领域取得的突破性进展，利用基于深度学习神经网络的图像识别技术，来对顾客购买的商品进行自动识别，已经变得完全可行。另一方面，由于计算机运算能力的提升，在真实场景中大规模应用这种技术，并结合完善的电子在线支付系统，通过分析安装在售货柜上的多个摄像头所采集到的数据来对顾客消费进行结算，实现智能无人售货的新零售产业模式的时代已经到来。基于深度学习神经网络的图像识别技术，利用大规模人工标注的图片数据集进行监督训练，具有强大的特征表达能力，通过对单张图片中所提取到的深度特征进行分类，即可识别图像中的所出现的物品。除此之外，相对于针对单张图片的静态识别技术，基于视频的多帧动态识别技术具有更广泛的应用场景，因为多帧图片中包含的信息更为丰富，且具有时间上的连续性，可以融合多帧信息来提高识别准确率。同时利用在多个角度所采集到视频流信息，可以对同一次用户操作和同一商品的多视角形态进行反复确认，从而缓解单一视角中的物体遮挡所带来的不利影响。因此，利用深度学习强大的特征表达能力以及丰富冗余的多视角数据，对用户购买的商品进行动态识别是完全可行且有价值的。申请号2017102606931公开了一种基于视频的物体识别追踪方法...

【技术保护点】
1.一种用于无人售货柜的多角度视频融合的商品识别算法，其特征在于，包括以下步骤：步骤一、对采集到的视频数据进行预处理，进一步包括：采集视频数据和对采集到的视频数据进行动态区域检测，得到所述视频数据中视频帧的动态区域；步骤二、对所述视频数据中视频帧进行关键帧采样；步骤三、构建深度卷积神经网络模型；步骤四、利用采样的关键帧对所述模型进行训练和精度测试，在商品识别的精度达到预期后，部署所述模型，该步骤进一步包括：特征提取、特征融合、特征识别；步骤五、来自无人售货柜的不同角度摄像头的视频数据经预处理和关键帧采样后输入所述模型，得到识别出的商品种类和对应的商品数量。

【技术特征摘要】
1.一种用于无人售货柜的多角度视频融合的商品识别算法，其特征在于，包括以下步骤：步骤一、对采集到的视频数据进行预处理，进一步包括：采集视频数据和对采集到的视频数据进行动态区域检测，得到所述视频数据中视频帧的动态区域；步骤二、对所述视频数据中视频帧进行关键帧采样；步骤三、构建深度卷积神经网络模型；步骤四、利用采样的关键帧对所述模型进行训练和精度测试，在商品识别的精度达到预期后，部署所述模型，该步骤进一步包括：特征提取、特征融合、特征识别；步骤五、来自无人售货柜的不同角度摄像头的视频数据经预处理和关键帧采样后输入所述模型，得到识别出的商品种类和对应的商品数量。2.如权利要求1所述的一种用于无人售货柜的多角度视频融合的商品识别算法，其特征在于，步骤一进一步包括：采用时序动态图算法对视频数据中连续的多帧图像进行计算，得到所述视频数据的时序动态图，然后利用所述时序动态图得到所述视频数据对应的动态区域掩码，对所述动态区域掩码进行平滑处理，将处理后的动态区域掩码应用到所述视频数据对应的每一个视频帧上，获得所述视频数据中的动态区域，并将非动态区域内的像素全部设为零。3.如权利要求1所述的一种用于无人售货柜的多角度视频融合的商品识别算法，其特征在于，所述采集到的视频数...

【专利技术属性】
技术研发人员：蔡丁丁，方无迪，唐开，刘钰涛，张运辉，
申请(专利权)人：武汉市哈哈便利科技有限公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人