物体检测装置及方法、终端设备制造方法及图纸

技术编号：26792830 阅读：54 留言：0更新日期：2020-12-22 17:08

本发明专利技术实施例提供一种物体检测装置及方法、终端设备，由于用于特征提取的混洗单元中的所有卷积层的输入通道和输出通道的数量相同，不需要进行特征的扩展和压缩，从而降低了对处理器的内存和性能要求并提高了处理速度，另外，该混洗单元具有至少一个深度可分离卷积层，大大降低了FLOPs等对于处理器的内存和性能要求，同时，相比于Yolo‑Darknet53等网络，其对处理器的要求大大降低而识别精度几乎相同，因此，提供了一种轻量化、处理速度快且识别精度较高的检测方法，从而能够应用于内存和性能有限的终端设备上，并获得较好的识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
物体检测装置及方法、终端设备
本专利技术涉及信息

技术介绍
近年来，在深度学习的帮助下，计算机视觉领域的研究取得了很大的进步。深度学习是指在分层神经网络上运用各种机器学习算法解决图像、文本等各种问题的算法集合。深度学习的核心是特征学习，旨在通过分层神经网络获取分层次的特征信息，从而解决以往需要人工设计特征的重要难题。目前，出现了一些较为流行的深度学习方法，例如，Yolo网络是一种有发展前景的用于目标识别和检测的深度学习方法。例如，具有darknet53作为骨干网络结构的Yolo-Darknet53网络，由于其具有多尺度的目标检测和更好的分类器，因此其相比于单级(singlestage)的方法具有更快的处理速度和更高的识别精度，其中，darknet53结构用于进行特征的提取。应该注意，上面对技术背景的介绍只是为了方便对本专利技术的技术方案进行清楚、完整的说明，并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本专利技术的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。<...

【技术保护点】
1.一种物体检测装置，所述装置包括：/n特征提取单元，其用于提取输入图像中的特征；以及/n检测单元，其用于根据所述特征提取单元提取出的特征，对所述输入图像中的物体进行检测，/n其中，所述特征提取单元包括至少一个混洗单元，所述混洗单元包括多个卷积层，所述多个卷积层中的各个卷积层的输入通道和输出通道的数量相同，所述多个卷积层包括至少一个深度可分离卷积层。/n

【技术特征摘要】
1.一种物体检测装置，所述装置包括：
特征提取单元，其用于提取输入图像中的特征；以及
检测单元，其用于根据所述特征提取单元提取出的特征，对所述输入图像中的物体进行检测，
其中，所述特征提取单元包括至少一个混洗单元，所述混洗单元包括多个卷积层，所述多个卷积层中的各个卷积层的输入通道和输出通道的数量相同，所述多个卷积层包括至少一个深度可分离卷积层。

2.根据权利要求1所述的装置，其中，
所述至少一个混洗单元包括至少一个第一混洗单元和/或至少一个第二混洗单元，所述第一混洗单元是步长为1的混洗单元，所述第二混洗单元是步长为2的混洗单元。

3.根据权利要求2所述的装置，其中，
所述特征提取单元还包括：
第一卷积层，其对所述输入图像进行处理；以及
池化层，其对所述第一卷积层输出的特征进行池化处理，并将经过池化处理的特征输入到所述第一混洗单元或所述第二混洗单元中。

4.根据权利要求2所述的装置，其中，
所述第一混洗单元包括：
第一通道分裂模块，其将输入所述第一混洗单元的特征分裂为第一部分特征和第二部分特征；
第二卷积层，其对所述第二部分特征进行处理；
第一深度可分离卷积层，其对经过所述第二卷积层的第二部分特征进行处理；
第三卷积层，其对经过所述第一深度可分离卷积层的第二部分特征进行处理；
第一合并模块，其对所述第一部分特征和经过所述第三卷积层的第二部分特征进行合并；以及
第一混洗模块，其对合并后的所述第一部分特征和所述第二部分特征进行混洗处理。

5.根据权利要求2所述的装置，其中，
输入到所述第二混洗单元的特征包括第三部分特征和第四部分特征，
所...

【专利技术属性】
技术研发人员：康昊，谭志明，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人