一种融合领域知识和多阶深度特征的篮球比赛语义事件识别方法技术

技术编号：19215999 阅读：36 留言：0更新日期：2018-10-20 06:49

一种基于融合领域知识和深度多阶特征的篮球比赛语义事件识别方法，实现对篮球比赛中语义事件的自动识别。随着计算机视觉理论与深度神经网络的不断发展，基于内容的视频语义事件分析技术不断完善。该方案首先基于篮球领域先验知识对篮球语义事件划分为事件准备阶段，事件发生阶段和事件后续阶段。然后提取视频序列的全局和群体运动模式，随后通过分层网络对多阶段网络提取的特征进行融合，最后通过长短期记忆网络实现时域信息整合，实现篮球语义事件的识别。此发明专利技术对大规模篮球视频数据的智能化存储与检索以及篮球视频专业自动化战术分析奠定了基础。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合领域知识和多阶深度特征的篮球比赛语义事件识别方法
本专利技术属于计算机视觉的视频语义事件识别领域，涉及基于深度神经网络的时空域特征提取与融合，具体涉及基于篮球领域知识的视频阶段划分以及基于卷积神经网络CNN和长短期记忆网络LSTM的特征提取与融合，提出了一种基于领域知识的多阶段群体行为识别的深度学习方法。
技术介绍
视频语义事件识别是视频分析与理解领域中的关键技术之一。随着深度神经网络的不断发展以及科学计算设备的更新换代，基于深度学习的视频内容分析的方法发展迅速，应用领域不断得以拓展。主要应用领域有：智能视频监控领域，例如基于智能化视频语义分析技术实现公共场所的实时监控，突发事件预警等；视频检索与存储领域，比如应用视频语义分析技术实现大规模视频数据的智能化存储，审查以及检索等；体育视频分析领域，基于对体育视频的语义分析，实现对于体育赛事的辅助训练以及战术分析等。本专利技术中的视频语义事件分类方法主要针对篮球视频中的事件分类。篮球赛事属于一种有计划的高协同群体行为，视频中的事件由多级别语义信息组成，一个完整的事件可以表达为不同运动员个体行为的集合，同时也可以表达为运动员群体之间运动模式的变化规律。通过对视频帧之间的光流图进行提取，即可获得群体和全局的融合运动模式(globalandcollectivemotionpatternGCMP)，如图1所示。接着对光流域图像进行空间域特征提取，并将空间域特征在时间域上进行整合，得到运动模式的时空域特征表达进行事件分类。在一个完整的篮球语义事件中，可以划分为三个不同的阶段。即事件准备阶段、事件发生阶段和事件后续...

【技术保护点】
1.一种融合领域知识和多阶深度特征的篮球比赛语义事件识别方法,其特征在于，首先根据篮球比赛中的领域知识将一个完整的篮球语义事件划分为事件准备阶段、事件发生阶段和事件后续阶段；随后提取事件发生阶段视频序列的全局与群体运动模式，此部分特征通过光流图进行表达；将提取出的全局与群体运动模式通过卷积神经网络CNN提取空间域特征，随后应用长短期记忆网络LSTM整合空间域特征，实现基于事件发生阶段的五类事件分类即三分球，抢断，罚篮，扣篮，两分球+上篮；针对上篮和两分球，此部分事件在事件发生阶段不做判别，而是合并为一个事件进行分类；随后，将此部分事件的事件准备阶段的全局与群体运动模式序列输入到CNN+LSTM网络中进行上篮和两分球判别，最后将两阶段的特征进行融合得到六类事件的预测结果；对于事件成功或失败属性的判别，通过事件后续阶段的视频序列RGB空间特征提取与分类，实现对事件成功失败属性的预测。

【技术特征摘要】
1.一种融合领域知识和多阶深度特征的篮球比赛语义事件识别方法,其特征在于，首先根据篮球比赛中的领域知识将一个完整的篮球语义事件划分为事件准备阶段、事件发生阶段和事件后续阶段；随后提取事件发生阶段视频序列的全局与群体运动模式，此部分特征通过光流图进行表达；将提取出的全局与群体运动模式通过卷积神经网络CNN提取空间域特征，随后应用长短期记忆网络LSTM整合空间域特征，实现基于事件发生阶段的五类事件分类即三分球，抢断，罚篮，扣篮，两分球+上篮；针对上篮和两分球，此部分事件在事件发生阶段不做判别，而是合并为一个事件进行分类；随后，将此部分事件的事件准备阶段的全局与群体运动模式序列输入到CNN+LSTM网络中进行上篮和两分球判别，最后将两阶段的特征进行融合得到六类事件的预测结果；对于事件成功或失败属性的判别，通过事件后续阶段的视频序列RGB空间特征提取与分类，实现对事件成功失败属性的预测。2.根据权利要求1所述的识别方法，其特征在于，采用卷积神经网络和长短期记忆网络即CNN+LSTM来实现多阶段篮球事件的预测，事件包括三分球、两分球、上篮、罚篮、扣篮和抢断，两类事件分类模型的输入数据是事件准备阶段的视频序列的光流图像，输出是上篮和两分球的预测结果；五类事件分类模型的输入数据是事件发生阶段的视频序列光流图像，输出是五类事件预测结果；在测试阶段，输入一个标签未知的篮球事件视频序列，首先会将事件发生阶段的视频序列光流图像作为输入，通过CNN+LSTM事件五分类网络提取特征并进行事件分类；如果预测结果是三分球、罚篮、扣篮或者抢断，输出结果将直接作为当前事件的标签；如果五分类网络的输出结果是上篮+两分球，此部分数据的事件准备阶段的视频序列光流图像将会被输入到两事件分类网络中进行进一步的事件判别，区分出两分球和上篮事件；最终，通过两阶段篮球语义事件分类方法，将会得到完整的六类事件预测结果；将CNN与LSTM网络相结合，CNN首先提取出视频序列中每一帧图像的空间特征，随后，这些序列特征按时域顺序输入到LSTM网络单元中进行时域特征整合，最终得到视频序列时空域特征表达，并进行事件类型识别。3.根据权利要求1所述的...

【专利技术属性】
技术研发人员：毋立芳，杨洲，贺娇瑜，简萌，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人