一种基于可回溯目标识别的智能寻物方法及系统技术方案

技术编号:34737653 阅读:21 留言:0更新日期:2022-08-31 18:28
本发明专利技术提供了一种基于可回溯目标识别的智能寻物方法及系统,包括:对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。本发明专利技术通过基于稀疏模型的实时目标识别技术在实现目标识别的同时提高了信号处理性能以达到实时计算;通过自适应目标特征字典构造技术对多场景目标复杂的问题有良好表现。有良好表现。有良好表现。

【技术实现步骤摘要】
一种基于可回溯目标识别的智能寻物方法及系统


[0001]本专利技术属于图像处理
,尤其涉及一种基于可回溯目标识别的智能寻物方法及系统。

技术介绍

[0002]人工智能日益融入人们的日常生活,智能制造如智能摄像头,使其实现高效精确地实现目标识别以寻物的功能对个人、工业领域十分重要。目前,目标识别是计算机视觉领域中的一个重要领域。而基于实时视频进行物品寻找更是该领域中的一项重要任务。
[0003]基于目标识别的寻物任务主要是以图像或者视频作为输入,目标识别在图像中找出目标,并确定目标位置。同一图像内的多个目标都能被识别和定位,以实现寻找物品的功能。传统方法实现基于目标识别的寻物任务是深度学习技术,如卷积神经网络,自动学习目标的固有特征以便识别目标。现有的深度学习实现目标识别的方法有两种,一种是从头开始训练模型,另一种是使用迁移学习方法,在有大量的数据支持下,深度学习具有高程度的准确性。
[0004]然而,当下的基于目标识别的寻物方法面临着一些问题:一方面,由于应用场景的复杂,不同场景识别的目标大小形状各不相同,背景参数等均有差异,在多样性的应用场景下出现准确率下降,从而泛用性不足。另一方面,基于深度神经网络的解决方案需要大量的训练数据与算力,难于实现实时分析计算并应用到需要实时处理的工程问题中。

技术实现思路

[0005]为解决上述技术问题,本专利技术提出了一种基于可回溯目标识别的智能寻物方法及系统,通过基于稀疏模型的实时目标识别技术在实现目标识别的同时提高了信号处理性能以达到实时计算;通过自适应目标特征字典构造技术对多场景目标复杂的问题有良好表现。
[0006]一方面为实现上述目的,本专利技术提供了一种基于可回溯目标识别的智能寻物方法,包括:
[0007]对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;
[0008]对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;
[0009]提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。
[0010]可选地,对所述视频关键帧进行预处理包括:按时间回溯倒叙排列所述视频关键帧。
[0011]可选地,对所述场景视频进行稀疏模型建模处理包括:引入行列式约束构成稀疏模型;
[0012]所述行列式约束为:
[0013]f(H)=max(det(HH
T
))
[0014]其中,H为稀疏矩阵,H
T
为稀疏矩阵H的转置,det()为行列式。
[0015]可选地,构造所述自适应目标字典包括:
[0016]对所述自适应目标字典施加正交约束;
[0017]将施加正交约束后的所述自适应目标字典进行Cayley变换处理,并加入Barzilai

Borwein步长。
[0018]可选地,提取所述视频信号的视频关键帧的方式为:采用关键帧提取模型;
[0019]所述关键帧提取模型为:
[0020][0021]其中,J
GMC
(X)为稀疏约束,Y为视频信号矩阵,F为Frobenius范数,为求解最小F范数下参数的取值。
[0022]另一方面为实现上述目的,本专利技术还提供了一种基于可回溯目标识别的智能寻物系统,包括:采集模块、识别模块、构造模块和寻物模块;
[0023]所述采集模块用于对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;
[0024]所述识别模块用于对所述视频信号采用YOLO目标识别算法,识别所述视频信号中的目标;
[0025]所述构造模块用于构造自适应目标字典,对所述视频信号采用所述自适应目标字典进行学习;
[0026]所述寻物模块用于提取所述视频信号的视频关键帧,对所述视频关键帧进行处理,获取所述目标最后出现的位置。
[0027]可选地,所述寻物模块中对所述视频关键帧进行处理包括:按时间回溯倒叙排列所述视频关键帧。
[0028]可选地,所述采集模块中对所述场景视频进行稀疏模型建模处理包括:引入行列式约束构成稀疏模型;
[0029]所述行列式约束为:
[0030]f(H)=max(det(HH
T
))
[0031]其中,H为稀疏矩阵,H
T
为稀疏矩阵H的转置,det()为行列式。
[0032]可选地,所述构造模块中构造所述自适应目标字典包括:
[0033]对所述自适应目标字典施加正交约束;
[0034]将施加正交约束后的所述自适应目标字典进行Cayley变换处理,并加入Barzilai

Borwein步长。
[0035]与现有技术相比,本专利技术具有如下优点和技术效果:
[0036]本专利技术通过提出种基于可回溯目标识别的智能寻物方法及系统,能够实现快速定位寻物;
[0037]本专利技术通过设计基于稀疏模型的目标识别以优化目标识别的效率以做到实时处理;
[0038]本专利技术通过构造稀疏目标字典,实现对不同场景的目标实现学习自适应字典,优化了对不同环境不同场景的适用能力。
附图说明
[0039]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0040]图1为本专利技术实施例1的一种基于可回溯目标识别的智能寻物方法流程示意图;
[0041]图2为本专利技术实施例1的基于稀疏模型的目标识别的流程示意图;
[0042]图3为本专利技术实施例1的基于稀疏模型构造自适应目标字典的流程示意图;
[0043]图4为本专利技术实施例1的基于可回溯关键帧的寻物算法的流程示意图;
[0044]图5为本专利技术实施例2的一种基于可回溯目标识别的智能寻物系统结构示意图。
具体实施方式
[0045]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0046]需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0047]实施例1
[0048]如图1所示,本实施例提供了一种基于可回溯目标识别的智能寻物方法,包括:
[0049]对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;
[0050]对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;
[0051]提取所述视频信号的视频关键帧,对所述视频关键帧进行处理,获取所述目标最后出现的位置。
[0052]进一步地,识别所述视频信号中的目标还包括:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于可回溯目标识别的智能寻物方法,其特征在于,包括:对场景视频进行稀疏模型建模处理,获得稀疏模型的视频信号;对所述视频信号采用YOLO目标识别算法,并基于所述稀疏模型构造自适应目标字典,识别所述视频信号中的目标;提取所述视频信号的视频关键帧,对所述视频关键帧进行预处理,获取所述目标最后出现的位置。2.根据权利要求1所述的基于可回溯目标识别的智能寻物方法,其特征在于,对所述视频关键帧进行预处理包括:按时间回溯倒叙排列所述视频关键帧。3.根据权利要求1所述的基于可回溯目标识别的智能寻物方法,其特征在于,对所述场景视频进行稀疏模型建模处理包括:引入行列式约束构成稀疏模型;所述行列式约束为:f(H)=max(det(HH
T))
其中,H为稀疏矩阵,H
T
为稀疏矩阵H的转置,det()为行列式。4.根据权利要求1所述的基于可回溯目标识别的智能寻物方法,其特征在于,构造所述自适应目标字典包括:对所述自适应目标字典施加正交约束;将施加正交约束后的所述自适应目标字典进行Cayley变换处理,并加入Barzilai

Borwein步长。5.根据权利要求1所述的基于可回溯目标识别的智能寻物方法,其特征在于,提取所述视频信号的视频关键帧的方式为:采用关键帧提取模型;所述关键帧提取模型为:其中,J
GMC
(X)为稀疏约束,Y为视频信号矩阵,F为Frobe...

【专利技术属性】
技术研发人员:李玉洁马子航丁数学谭本英
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1