A method and device for object detection using a region based deep learning model are described. On the one hand, a method is provided, in which the area recommendation network (RPN) is used to identify the region of interest (RoI) in the image by assigning confidence levels, and the confidence level of the assigned RoI is used to improve the background score allocated to the RoI by the downstream classifier, and the background fraction is used for the flexible maximum function to calculate the final class of each object class. Probability. One
【技术实现步骤摘要】
使用基于区域的深度学习模型的对象检测的方法和设备本申请要求于2016年12月7日提交到美国专利商标局的第62/431,086号美国临时专利申请的优先权以及于2017年4月4日提交到美国专利商标局的第15/478,947号美国非临时专利申请的优先权,所述美国专利申请的全部内容通过引用合并于此。
本公开总体涉及机器学习,更具体地讲,涉及用于对象检测的深度学习机的系统和方法。
技术介绍
机器学习技术正不断发展并且已经开始支持从网络搜索、内容过滤、商业网站上的自动推荐、自动博弈到对象检测、图像分类、语音识别、机器翻译以及药物发现和基因组学的现代社会的很多方面。机器学习的领域中的当前技术状态为深度神经网络,其使用由利用多级抽象来学习数据(通常,非常大量的数据)的表示的多个处理层组成的计算模型—因此,称为术语“深度学习”、“深层网络”等。参见,例如,LeCun,Yann,YoshuaBengio和GeoffreyHinton.“Deeplearning.”Nature,vol.521,pp.436-444(28May2015),其通过引用全部合并于此。深度学习方法对于一般的对象检测已经显示出优越的性能。然而,即使使用深度学习,特定对象和/或特定情况的检测也更加困难。具有很多现实应用(诸如,自主驾驶和高级驾驶辅助系统)的行人检测是经由深度学习的检测多少受到各种限制结果的一个领域。
技术实现思路
根据本公开的一方面,提供一种使用基于区域的深度学习模型的对象检测的方法,所述方法包括:使用区域建议网络(RPN)通过分配置信水平来识别图像中的感兴趣区域(RoI);使用分配的RoI的 ...
【技术保护点】
1.一种使用基于区域的深度学习模型的对象检测的方法,包括:
【技术特征摘要】
2016.12.07 US 62/431,086;2017.04.04 US 15/478,9471.一种使用基于区域的深度学习模型的对象检测的方法,包括:使用区域建议网络通过分配置信水平来识别图像中的感兴趣区域;使用分配的感兴趣区域的置信水平来提高由下游分类器分配给每个感兴趣区域的背景分数;在柔性最大值函数中使用提高的背景分数来计算每个对象类的最终类概率。2.根据权利要求1所述的使用基于区域的深度学习模型的对象检测的方法,其中,对象检测为行人检测。3.根据权利要求1所述的使用基于区域的深度学习模型的对象检测的方法,其中,基于区域的深度学习模型为快速的基于区域的卷积神经网络。4.根据权利要求1所述的使用基于区域的深度学习模型的对象检测的方法,其中,基于区域的深度学习模型为基于区域的全卷积网络。5.根据权利要求1所述的使用基于区域的深度学习模型的对象检测的方法,其中,置信水平包括感兴趣区域为背景的概率PB和感兴趣区域为前景的概率PF。6.根据权利要求5所述的使用基于区域的深度学习模型的对象检测的方法,其中,由下游分类器分配给感兴趣区域的背景分数是s0,根据以下公式提高s0:7.根据权利要求1所述的使用基于区域的深度学习模型的对象检测的方法,其中,使用分配的感兴趣区域的置信水平来提高由下游分配器分配给每个感兴趣区域的背景分数的步骤包括:迭代地精细化提高的背景分数。8.根据权利要求1所述的使用基于区域的深度学习模型的对象检测的方法,其中,还使用语义分割掩码提高由下游分类器分配给每个感兴趣区域的背景分数。9.根据权利要求1所述的使用基于区域的深度学习模型的对象检测的方法,其中,还使用光流大小来提高由下游分类器分配给每个感兴趣区域的背景分数。10.一种能够使用基于区域的深度学习模型进行对象检测的设备,包括:一个或多个非暂时性计算机可读介质;至少一个处理器,当执行存储在所述一个或多个非暂时性计算机可读介质中的指令时,执行以下步骤:使用区域建议网络通过分配置信水平来识别图像中的感兴趣区域;使用分配的感兴趣区域的置信水平来提高由下游分类器分配给每个感兴趣区域的背景分数;在柔性最大值函数中使用提高的背景分数来计算每个对象类的最终类概率。11.根据权利要求10所述的能够...
【专利技术属性】
技术研发人员:阿尔温德·叶德拉,李正元,马赛尔·纳萨尔,穆斯塔法·艾尔可哈米,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:韩国,KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。