基于环境感知网络发现视频中社会交互组的方法及系统技术方案

技术编号:41399784 阅读:30 留言:0更新日期:2024-05-20 19:24
本申请提供一种基于环境感知网络发现视频中社会交互组的方法及系统,包括:环境感知网络设计两类环境感知视觉线索来表示影响社会交互的因素;场景感知视觉线索,采用3D网络提取输入视频段特征作为视觉表示,利用编码器提取空时特征;人类感知视觉线索,利用边界框和感兴趣区域作为心理学中影响交互的姿态开放性、朝向和位置的视觉表示;从边界框中提取距离特征,从感兴趣区域中提取个人特征,距离特征和个人特征作为人类环境的视觉表示;将时空特征、距离特征和个人特征融合,获取高阶的社会交互强度特征,得到人与人之间的交互强度矩阵。本申请借用心理学,能从更为本质的角度去发现社会交互,利用深度学习的方法量化人与人之间的交互强度。

【技术实现步骤摘要】

本申请涉及计算机视觉,具体地,涉及一种基于环境感知网络发现视频中社会交互组的方法及系统


技术介绍

1、社会交互是指试图影响或考虑他人主观体验或意图的行为。社会交互在人类社会中十分常见,并在人类的进化过程中起到重要作用。人们在进行社会交互形成的组称为社会交互组。发现社会交互组是人类社会行为分析中的一项基本任务,它可以很好地扩展到一些与群体相关的计算机视觉任务,例如群体异常检测,群体动作识别等。

2、目前针对社会交互识别的方法有:

3、(1)根据人与人之间的接近性来发现社会交互。这类方法一类特点是采用社会学中提出的f-formation,通过预先定义的形状,在视频中寻找和该形状匹配的人群,完成社会交互的发现,但是这类方法需要额外的信息,如人头部的朝向等,而这些信息难以从视频中直接捕获;

4、(2)根据预先定义的动作类别发现社会交互。这类方法的特点是根据预定义的交互类型动作完成视频中人与人之间的社会交互发现。但是,这类方法的最大缺点是需要给定具体的动作类别,而我们实际的社会交互是千变万化的,给定具体的动作类别是不足以覆盖全部本文档来自技高网...

【技术保护点】

1.一种基于环境感知网络发现视频中社会交互组的方法,其特征在于,包括:

2.根据权利要求1所述的基于环境感知网络发现视频中社会交互组的方法,其特征在于,所述场景感知视觉线索对应的是从全局角度考虑的人周围的静态目标和动态信息的场景环境;

3.根据权利要求1所述的基于环境感知网络发现视频中社会交互组的方法,其特征在于,所述采用3D网络提取输入视频段特征,作为视觉表示,并利用编码器提取空时特征,包括:

4.根据权利要求1所述的基于环境感知网络发现视频中社会交互组的方法,其特征在于,所述利用边界框和感兴趣区域作为心理学中影响交互的姿态开放性、朝向和位置的视觉表...

【技术特征摘要】

1.一种基于环境感知网络发现视频中社会交互组的方法,其特征在于,包括:

2.根据权利要求1所述的基于环境感知网络发现视频中社会交互组的方法,其特征在于,所述场景感知视觉线索对应的是从全局角度考虑的人周围的静态目标和动态信息的场景环境;

3.根据权利要求1所述的基于环境感知网络发现视频中社会交互组的方法,其特征在于,所述采用3d网络提取输入视频段特征,作为视觉表示,并利用编码器提取空时特征,包括:

4.根据权利要求1所述的基于环境感知网络发现视频中社会交互组的方法,其特征在于,所述利用边界框和感兴趣区域作为心理学中影响交互的姿态开放性、朝向和位置的视觉表示,其中:

5.根据权利要求1所述的基于环境感知网络发现视频中社会交互组的方法,其特征在于,所述采用基于transformer的环境感知机制作为特征融合网络,将所述时空特征、距离特征和个人特征融合,获取高阶的...

【专利技术属性】
技术研发人员:杨华于家祺
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1