当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于自表示密度图的鸟群计数方法及装置制造方法及图纸

技术编号:42064730 阅读:18 留言:0更新日期:2024-07-19 16:48
本发明专利技术公开了一种基于自表示密度图的鸟群计数方法及装置,包括:对密度图进行自表示学习,同时基于密度图引导的样本自适应掩码对编码后的图像和真实密度图进行掩码,用于平衡前背景信息;对当前图像和相邻图像的时序信息进行估计,并生成对应的光流信息图,所述光流信息图将相邻图像的预测密度图映射到当前时刻;将当前图像的预测密度图和映射后的相邻图像预测密度图进行堆叠作为时序融合的输入,得到最终的融合预测密度图;基于融合预测密度图对鸟类轨迹、鸟类活动场景进行分析,实现对野外鸟类的保护。装置包括:处理器和存储器。本发明专利技术提高模型对在鸟群活动分析以及鸟类保护等高动态场景下的适应性。

【技术实现步骤摘要】

本专利技术涉及目标计数领域,尤其涉及一种基于自表示密度图的鸟群计数方法及装置


技术介绍

1、计算机视觉中的鸟群计数任务,旨在使用一个模型对鸟群密度进行统计分析,来对鸟类监控、鸟类保护、鸟类轨迹分析等自然场景中的鸟群数量进行估计。随着生产力的发展,鸟类保护已经逐渐走入人类的认知之中,对大量且普遍微小的鸟类目标进行快速而准确的活动分析越来越被需要,使用高效的鸟群计数能够有效解决这一问题。另一方面,在真实应用场景中,相较于图像,视频数据更为常见,然而现有的单帧图像的计数方法在处理视频数据时无法利用其时序信息,从而限制了性能上限,因此设计适用于视频数据的计数方法正受到越来越多的关注。近年来,这一任务备受计算机视觉领域相关研究者的关注,经过基于检测、基于回归等计数方法的演化,目前所采用的大多是通过生成像素级密度图来完成数量的计算。

2、由于真实密度图生成需要对可见光图像进行点标注或框标注,所需要的标注代价十分昂贵,特别是在密集场景下或视频场景下。由于高昂的标注代价,现有的计数数据集大多规模受限,从而影响数据驱动的深度学习方法在计数任务上的性能上限。...

【技术保护点】

1.一种基于自表示密度图的鸟群计数方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于自表示密度图的鸟群计数方法,其特征在于,所述对密度图进行自表示学习具体为:

3.根据权利要求1所述的一种基于自表示密度图的鸟群计数方法,其特征在于,所述掩码为:

4.根据权利要求1所述的一种基于自表示密度图的鸟群计数方法,其特征在于,所述密度图使用预训练的Vision Transformer作为主干网络,以双流网络结构提取图像和密度图特征并分别完成图像到密度图的回归和密度图的重建;双流网络结构中的两个分支共享参数权重,每个分支由12层Vision Tra...

【技术特征摘要】

1.一种基于自表示密度图的鸟群计数方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于自表示密度图的鸟群计数方法,其特征在于,所述对密度图进行自表示学习具体为:

3.根据权利要求1所述的一种基于自表示密度图的鸟群计数方法,其特征在于,所述掩码为:

4.根据权利要求1所述的一种基于自表示密度图的鸟群计数方法,其特征在于,所述密度图使用预训练的vision transformer作为主干网络,以双流网络结构提取图像和密度图特征并分别完成图像到密度图的回归和密度图的重建;双流网络结构中的两个分支共享参数权重,每个分支由12层vision transformer块组成,并使用在多模态数据上进行预训练的权重对双流网络进行初始化。

5.根据权利要求1所述的一种基于自表示密度图的鸟群计数方法,其特征在于,所述时序融合为一个交叉注意力层,相邻帧的预测密度图作为k和v,而当前帧的预测密度图作为q,其中,q,k,v分别为transformer中计算注意力时使用的query,key,value向量。

6.根据权利要求4...

【专利技术属性】
技术研发人员:卢泉昊曹兵朱鹏飞胡清华
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1