一种基于聚类的顾客数量统计方法技术

技术编号:27132515 阅读:13 留言:0更新日期:2021-01-25 20:17
本发明专利技术公开了一种基于聚类的顾客数量估计方法,包括如下步骤:S101:使用SSDMobileNetV2模型对多个摄像头的视频帧进行行人检测,得到检测框坐标,并过滤掉不满足尺寸大小和比例的检测框,以保证得到的人形相对完整,利于行人重识别模型特征提取和特征间比对;S102:使用行人重识别模型Osnet进行行人特征提取,对于每个行人检测框,可计算得到1*512维的特征。本发明专利技术采用深度卷积网络进行顾客判断,避免了非顾客人员进店计数,统计出更真实、准确的顾客数量,综合全店多个摄像头视野区域进行顾客分析和统计,减轻了特定狭窄区域人群密集时目标遮挡或快速移动导致的客流量统计准确性低的问题,与已有的视频统计方法相比,无需额外的统计感兴趣区域配置。无需额外的统计感兴趣区域配置。无需额外的统计感兴趣区域配置。

【技术实现步骤摘要】
一种基于聚类的顾客数量统计方法


[0001]本专利技术涉及客流量统计
,具体为一种基于聚类的顾客数量统计方法。

技术介绍

[0002]客流量是店铺运营的核心指标,有效、科学的进行客流量统计分析,能够帮助客户快速及时对市场做出经营决策,挖掘销售潜力,实现长效盈利,目前,针对客流量统计主要有五种方法:第一,人工手持方法,该方法是一种比较早的客流统计方式,通过计数器点按计数,第二,闸门、踏板,即在店的入口处设置进出闸门,第三,红外探头,在店入口处设置红外发射器,通过人进出店时阻挡红外线的次数进行计数,第四,WiFi信号统计,通过在店内布置WiFi信号采集设备,利用手机发出ping信号的特点,收集信号进行统计,第五,视频统计,该方法主要通过头肩或行人检测、跟踪等多方法结合实现,计数时利用分割线对图像进行区域划分,之后通过对目标经过分割区域过程实现人数统计。
[0003]相比人工手持、闸门或踏板、红外探头,WiFi信号统计和视频统计方法可自动避免人员进店的重复计数,但WiFi信号统计只能对打开了WiFi的手机进行计数,并且可能会把附近不在门店的手机也进行了统计,准确度不如视频统计方法高,视频统计方法除可借助人脸或行人重识别技术自动避免人员进店的重复计数外,还可以分析出顾客在特定区域内的停留数量,形成热力图,在新零售店铺场景中应用越来越广泛。
[0004]目前,视频统计方法主要存在两个问题:首先,视频统计的方法虽然可以避免重复计数,但无法避免非顾客计数,在实际进店人员中除了顾客,还包含非顾客人员,如店员、保洁、快递员等,真实的客流量应只统计顾客进店,其次,视频统计方法工作区域集中于门口或单摄像头下设定的感兴趣区域,区域较为狭小,当人群密集时目标相互遮挡或目标快速移动会导致客流量统计存在较大误差。
[0005]基于此,本专利技术提出一种基于聚类的视频客流统计方法,解决已有方法中受非顾客人员、特殊情况下狭窄区域客流量统计准确性低的问题,以统计出更真实、准确的顾客数量,以门店某时间段内多个摄像头视频作为输入,使用SSD-MobileNetV2模型对视频中的行人进行检测,然后基于OSNet模型对检测到的行人提取特征,按照特征间的相似度进行聚类,每一个类中包含行人特征、时间和空间位置等信息,最后,将每个聚类作为深度卷积神经分类网络(如LSTM)的输入,基于聚类的多种信息判断聚类是否为顾客,满足阈值条件的聚类个数即为顾客数量。

技术实现思路

[0006]本专利技术的目的在于提供一种基于聚类的顾客数量统计方法,具备准确度高的优点,解决了
技术介绍
中所提到的问题。
[0007]为实现上述目的,本专利技术提供如下技术方案:一种基于聚类的顾客数量估计方法,包括如下步骤:S101:使用SSDMobileNetV2模型对多个摄像头的视频帧进行行人检测,得到检测框坐
标,并过滤掉不满足尺寸大小和比例的检测框,以保证得到的人形相对完整,利于行人重识别模型特征提取和特征间比对。
[0008]S102:使用行人重识别模型Osnet进行行人特征提取,对于每个行人检测框,可计算得到1*512维的特征。
[0009]S103:计算特征间余弦距离相似度。
[0010]S104:特征聚类,按照余弦距离相似度从小到大的顺序,合并满足阈值条件的类别。
[0011]S105:判断合并前、后类别数量是否变化;如合并数量发生变化,则执行S106,如合并前后类别数量不再发生变化,则执行S107。
[0012]S106:更新特征,对于合并到同一类别的特征,计算其平均特征,重复S103~S105过程。
[0013]S107:使用深度卷积神经网络对聚类进行顾客判断,如满足设定的阈值,则进行计数,否则不进行计数。
[0014]优选的,所述S104:包括如下子步骤:S1041:判断待合并类别是否是同摄像头下同时刻特征,如是不进行合并,如不是执行S1042;S1042:判断待合并类别是否满足最小类内距离小于0.4和最大类内距离小于0.6的条件,假设A、B、C三个类别待合并,假设A和B余弦距离小于0.4,则将其合并为[A,B],如果C和B间余弦距离小于0.4,但和A间的余弦距离大于0.6,则不能将C合并到[A,B]中,如果和A间的余弦距离小于0.6,则将C合并到[A,B]中。
[0015]优选的,深度卷积神经网络顾客判断模型建立包括如下步骤:S201:基于S106得到的聚类结果,包括检测框坐标、特征和时间等信息,将其按照时间顺序排列;S202:将检测框坐标由二维图像坐标转到三维相机坐标,以获取顾客在某时刻的实际空间位置,转换所用到的相机参数由实际标定和测量得到;S203:人工标注聚类类别,判断每个聚类是否为顾客并进行标记,得到一定数量的训练集;S204:将行人特征、时间和检测框坐标等信息以及是否为顾客标签信息作为深度卷积神经网络输入并进行训练,输出为顾客的概率值,得到深度卷积神经网络顾客判断模型。
[0016]优选的,所述S101行人检测的视频均来自于摄像头,摄像头数量为一个或多个。
[0017]与现有技术相比,本专利技术的有益效果如下:1、采用深度卷积网络进行顾客判断,避免了非顾客人员进店计数,统计出更真实、准确的顾客数量。
[0018]2、综合全店多个摄像头视野区域进行顾客分析和统计,减轻了特定狭窄区域人群密集时目标遮挡或快速移动导致的客流量统计准确性低的问题。
[0019]3、与已有的视频统计方法相比,无需额外的统计感兴趣区域配置。
附图说明
[0020]图1为本专利技术实施流程图;
图2为本专利技术深度卷积神经网络顾客判断模型实施方式流程图。
具体实施方式
[0021]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]请参阅图1-2,本专利技术提供一种技术方案:如图1所示,本专利技术实施例一种基于聚类的顾客数量估计方法,包括如下步骤:S101:使用SSDMobileNetV2模型对多个摄像头的视频帧进行行人检测,得到检测框坐标,并过滤掉不满足尺寸大小和比例的检测框,以保证得到的人形相对完整,利于行人重识别模型特征提取和特征间比对。
[0023]S102:使用行人重识别模型Osnet进行行人特征提取,对于每个行人检测框,可计算得到1*512维的特征。
[0024]SSDMObilenetV2行人检测模型和Osnet行人特征提取模型为已知公开的深度学习模型,不是本专利技术专利的重点,故不做详细介绍。
[0025]S103:计算特征间余弦距离相似度。
[0026]S104:特征聚类,按照余弦距离相似度从小到大的顺序,合并满足阈值条件的类别,包括如下子步骤:S1041:判断待合并类别是否是同摄像头下同时刻特征,如是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于聚类的顾客数量估计方法,其特征在于:包括如下步骤:S101:使用SSDMobileNetV2模型对多个摄像头的视频帧进行行人检测,得到检测框坐标,并过滤掉不满足尺寸大小和比例的检测框,以保证得到的人形相对完整,利于行人重识别模型特征提取和特征间比对;S102:使用行人重识别模型Osnet进行行人特征提取,对于每个行人检测框,可计算得到1*512维的特征;S103:计算特征间余弦距离相似度;S104:特征聚类,按照余弦距离相似度从小到大的顺序,合并满足阈值条件的类别;S105:判断合并前、后类别数量是否变化;如合并数量发生变化,则执行S106,如合并前后类别数量不再发生变化,则执行S107;S106:更新特征,对于合并到同一类别的特征,计算其平均特征,重复S103~S105过程;S107:使用深度卷积神经网络对聚类进行顾客判断,如满足设定的阈值,则进行计数,否则不进行计数。2.根据权利要求1所述的一种基于聚类的顾客数量统计方法,其特征在于:所述S104:包括如下子步骤:S1041:判断待合并类别是否是同摄像头下同时刻特征,如是不进行合并,如不是执行S1042;S1042:判断待合并类别是否满足...

【专利技术属性】
技术研发人员:杨惠雯林宇赵宇迪
申请(专利权)人:上海数川数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1