【技术实现步骤摘要】
一种基于多目标跟踪的智能售货柜商品计数方法
[0001]本专利技术涉及智能售货柜商品计数
,尤其涉及基于目标检测和多目标跟踪技术的商品计数方法。
技术介绍
[0002]智能售货柜是新零售时代的一种重要技术,基于计算机视觉的识别技术分为静态识别和动态识别。静态识别通过关键帧对比来识别商品,动态识别通过拍摄的视频识别商品。在视频中,商品会因为处于运动状态导致图像发生畸变,使得商品识别的准确率降低导致计数错误。
技术实现思路
[0003]本专利技术的目的是针对现有计数方法存在的问题,提出一种高效的基于多目标跟踪的智能售货柜商品计数方法,所述方法通过使用多线检测器对多目标跟踪模型的跟踪结果进行分级计数,提高了计数的准确性。
[0004]本专利技术采用的技术方案如下:
[0005]S1.获取消费者购买售货柜内商品的图像数据并进行标注,将图像数据按照9:1的比例划分为训练集和验证集。
[0006]S2.通过所述训练集对YOLOX目标检测模型进行训练,通过验证集对模型进行参数调整和验证,得到完成训练和调参的模型。
[0007]S3.通过售货柜预设的摄像头获取消费者的购物视频,以帧差为3对视频进行关键帧采样,将关键帧输入完成训练和调参的目标检测模型,获得关键帧中消费者购买的商品的位置信息和对应的类别信息。
[0008]S4.将获取的商品位置信息、类别信息和关键帧输入在MSMT17数据集上完成预训练的多目标跟踪模型StrongSORT获得商品的ID和对应的位置信息、类别信息 ...
【技术保护点】
【技术特征摘要】
1.一种基于多目标跟踪的智能售货柜商品计数方法,其特征在于,包括以下步骤:S1.获取消费者购买售货柜内商品的图像数据并进行标注;图像数据由售货柜预设的摄像头按照分辨率1920*1080帧率25获取连续的图像;对每张图像数据进行标注,即标记出每张图像上各个商品的左上角坐标(x1,y1)和右下角坐标(x2,y2);S2.使用S1中所述训练集对YOLOX目标检测模型进行训练,通过验证集对模型进行参数调整和验证,得到完成训练和调参的模型;训练模型阶段设定的训练的批次大小为128,采用多卡并行训练的方式,学习率为0.005,学习率采用余弦退火算法进行更新迭代,更新迭代周期为10次完整的训练集迭代,最小学习率为0;对模型进行200次完整的训练集迭代完成训练;S3.通过售货柜预设的摄像头获取消费者的购物视频,以帧差为3对视频进行关键帧采样,将关键帧输入完成训练的目标检测模型,获得关键帧中消费者购买的商品的位置信息和对应的类别信息;S4.将获取的商品的位置信息和对应的类别信息以及关键帧输入在MSMT17数据集上完成训练的StrongSORT多目标跟踪模型,多目标跟踪模型通过对比前后帧以及对检测出的商品的外观表征进行提取并计算相似性从而达到跟踪,最后多目标跟踪模型输出当前帧中商品的ID、位置信息和对应的类别;多目标跟踪模型的输出作为多线检测器的输入;S5.多线检测器是对多目标检测器输出结果进行的操作以及对操作过程中产生的数值发挥记录作用的属性所共同构成的,对于所述的属性包括:检测线Y1:y=470,Y2:y=600,Y3:y=700,Y4:y=800,Y5:y=900,以及5条检测线对应的检测线结算序列L1、L2、L3、L4和L5,以及5条检测线Y1、Y2、Y3、Y4和Y5分别将图像划分为6个区域,这6个区域对应的区域ID序列R1、R2、R3、R4、R5和R6,还包括1个检测器结算序列AMR,1个区域总计ID序列IAR,1个检测线结算集合UC,1个商品拿出计数字典TO和1个商品放回计数字典PB,需要指明的是字典的记录形式为字典键名为商品名称,键值为商品拿出或放回数量;作为本步骤的约定:称R1和Y1、R2和Y2、R3和Y3、R4和Y4、R5和Y5为对应关系,称当前区域的相邻区域为纵坐标小于当前区域并且在图像上间隔一条检测线的区域;在开始检测一段视频之前,上述各序列和集合均初始化为空,计数字典各键值初始化为0;定义序列D为多目标跟踪模型的输出按顺序组成的序列,由D:={d1,d2,d3,...,d
n
}表示,n为序列长度,序列具体由商品类别ID、类别信息CLS、左上横坐标x1、左上角纵坐标y1、右下角横坐标x2、右下角纵坐标y2形式的元组构成,即D中任意元素的形式为(ID,CLS,x1,y1,x2,y2),还需说明的是PB[CLS]指CLS类别的商品放回的数量,TO[CLS]指CLS类别的商品拿出的数量;考虑序列中的所有元素,遍历序列中的元素,设当前元素的索引为i,即当前元素为d
i
,y1和y2为d
i
中的左上角纵坐标和右下角纵坐标:S51.由公式(1)计算出d
i
对应的商品的中心点纵坐标Y
c
,在公式(1)计算出的Y
c
的基础上,遍历多线检测器设定的检测线,设当前检测线的索引为j,即当前检测线为Y
j
,j的取值范围为{1,2,3,4,5},Y
j
的纵坐标为y
j
,比较y
j
和Y
c
的大小:S52.在S51的基础上,当y
j
≥Y
c
时,执行公式(2)更新R
j
,并判断当前检测线是...
【专利技术属性】
技术研发人员:李建强,陈柳乐,王瑾,李韫昱,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。