【技术实现步骤摘要】
基于像素差异的对象检测相关申请的交叉引用本专利申请要求2020年2月13日提交的名称为“ObjectDetectionBasedOnPixelDifferences”的美国临时专利申请62/929706号的优先权权益,该专利申请的公开内容据此全文并入本文。
本公开整体涉及对象检测,并且具体地讲,涉及基于机器学习的对象检测。
技术介绍
对象检测是与计算机视觉和图像处理相关的计算机技术,其涉及在数字图像和视频中检测特定类(诸如人类、建筑物或汽车)的语义对象的实例。充分研究的对象检测域包括面部检测和行人检测。对象检测在计算机视觉的许多领域中具有应用,包括图像检索和视频监控。用于对象检测的传统方法首先限定特征,然后使用一些机器学习技术诸如支持向量机(SVM)来进行分类。更近的方法使用深度学习技术,该深度学习技术能够进行端对端对象检测而不明确限定特征并且通常基于卷积神经网络(CNN)。机器学习(ML)是对以下算法和数学模型的研究:计算机系统使用该算法和数学模型以渐进地改善其针对特定任务的性能。机器学习算法建立样 ...
【技术保护点】
1.一种方法,包括:/n在第一时间获得场景的第一图像;/n获得所述场景的至少一部分的第二图像,所述第二图像包括在不同于所述第一时间的第二时间捕获的图像信息;/n获得所述第一图像的一个或多个像素与所述第二图像的一个或多个对应像素之间的差异;/n将所获得的差异作为输入提供给机器学习模型;以及/n响应于提供所述输入,获得对所述第一图像或所述第二图像中的至少一者中描绘的对象或动作的识别作为来自所述机器学习模型的输出。/n
【技术特征摘要】 【专利技术属性】
20191101 US 62/929,706;20201012 US 17/068,7501.一种方法,包括:
在第一时间获得场景的第一图像;
获得所述场景的至少一部分的第二图像,所述第二图像包括在不同于所述第一时间的第二时间捕获的图像信息;
获得所述第一图像的一个或多个像素与所述第二图像的一个或多个对应像素之间的差异;
将所获得的差异作为输入提供给机器学习模型;以及
响应于提供所述输入,获得对所述第一图像或所述第二图像中的至少一者中描绘的对象或动作的识别作为来自所述机器学习模型的输出。
2.根据权利要求1所述的方法,还包括将所述第一图像或所述第二图像中的至少一者作为附加输入提供给所述机器学习模型。
3.根据权利要求2所述的方法,其中提供所获得的差异以及所述第一图像或所述第二图像中的所述至少一者包括级联所获得的差异和所述第一图像,并且将所述级联的结果作为单个输入提供给所述机器学习模型。
4.根据权利要求3所述的方法,其中所获得的差异包括差异图像,所述差异图像包括所述第一图像的所述像素中的每个像素与所述第二图像的每个对应像素之间的差异。
5.根据权利要求4所述的方法,其中所述第一图像和所述第二图像各自为多通道图像,其中获得所述差异包括获得针对所述多通道图像的每个通道的差异图像。
6.根据权利要求5所述的方法,其中级联所获得的差异和所述第一图像包括添加针对每个通道的所述差异图像作为所述第一图像的附加通道。
7.根据权利要求1所述的方法,还包括在获得所述差异之前对所述第一图像和所述第二图像执行图像预处理操作。
8.根据权利要求1所述的方法,其中获得所述第一图像的所述一个或多个像素与所述第二图像的所述一个或多个对应像素之间的所述差异包括获得所述第一图像的所述一个或多个像素与所述第二图像的所述一个或多个对应像素之间的原始差异或所述原始差异的绝对值。
9.根据权利要求8所述的方法,还包括在将所获得的差异作为所述输入提供给所述机器学习模型之前,将滤波器应用于所获得的差异。
10.根据权利要求1所述的方法,其中获得所述第二图像包括在不同于所述第一时间的所述第二时间捕获所述第二图像,并且其中所述第二时间在所述第一时间之前。
11.根据权利要求1所述的方法,其中获得所述第二图像包括通过组合各自在所述第一时间之前的对应时间捕获的多个附加图像来生成所述第二图像。
12.根据权利要求1所述的方法,其中获得所述第二图像包括从各自在所述第一时间之前的对应时间捕获的图像的候选池中选择所述第二图像。
13.根据权利要求1所述的方法,其中获得所述第一图像包括使用静止相机来捕获所述第一图像,其中获得所述第二图像包括利用所述静止相机来捕获所述第二图像,并且其中使用所述静止相机的相同物理像素来捕获所述第一图像的所述像素中的每个像素和所述第二图像的所述对应像素中的每个对应像素。
技术研发人员:A·J·普拉布,S·K·卡塔米法德,H·巴格赫里尼扎德,
申请(专利权)人:希侬人工智能公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。