基于深度强化学习的行为预测方法及装置制造方法及图纸

技术编号：18399514 阅读：45 留言：0更新日期：2018-07-08 19:49

本发明专利技术公开了一种基于深度强化学习的行为预测方法及装置，其中，方法包括：通过视频图像的帧提取人体骨架信息的动作特征；将动作特征根据人体机构化信息进行特征编码；通过深度强化学习对人体行为过程中有效的部位进行筛选，以预测人的行为。该方法通过在人体的重要位置提取局部图像块，利用图像块的特征的有序排列，从而在预测过程用有效地利用人体的结构化信息，有效地提升了行为预测的精度和性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的行为预测方法及装置
本专利技术涉及模式识别
，特别涉及一种基于深度强化学习的行为预测方法及装置。
技术介绍
对于人的行为分析已经在计算机视觉领域种得到了广泛的引用。作为行为分析的一个重要的分支，预测人的行为在实际中表现出了非常重要的应用，例如视频检测，异常行为检测和机器人交互。尽管在该领域中已经有很多工作，但是行为预测这个任务仍然是非常具有挑战性的任务。由于每个人的行为存在巨大的差异并且每个动作在时间和空间上存在明显的不同，因此行为预测的仍然存在巨大的困难。从一个完整的视频中识别动作通常是一件非常困难的事。例如，预测一个正要倒下的人能够尽早地救援他。于行为识别不同，行为预测的目的是充分利用观测到的部分视频，尽早地预测行为。行为预测的定义为在行为尚未完成的时候，通过部分观测的视频或序列推断正在进行的行为。基于部分观测的视频从空域和时域两个部分对正在实施的行为进行预测，关键是对实施的过程进行建模。相关技术中的大部分针对行为预测的工作可以分为主要的两大类：一类是通过模板匹配利用可靠的特征；另一类是开发分类模型。其中，第一类方法目标是设计一种基于模板的模型进行预测。然而，这种模板很容易被离群的样本影响，并且当实施的行为存在较大的姿态差异时，这类方法的性能通常会不理想。第二类方法致力于开发行为的时域特性，同时预测的准确性会随着观测的帧数增加而增加。然而，大多数现有的方法提取的是每一帧的全局特性从而利用时域信息。这类方法忽略了人体的必要的结构化信息。此外，全局特征的鉴别能力会被来自背景的噪声严重影响，如图1所示，从整帧提取传统特征的过程中会同时...

【技术保护点】
1.一种基于深度强化学习的行为预测方法，其特征在于，包括以下步骤：通过视频图像的帧提取人体骨架信息的动作特征；将所述动作特征根据人体机构化信息进行特征编码；以及通过深度强化学习对人体行为过程中有效的部位进行筛选，以预测人的行为。

【技术特征摘要】
1.一种基于深度强化学习的行为预测方法，其特征在于，包括以下步骤：通过视频图像的帧提取人体骨架信息的动作特征；将所述动作特征根据人体机构化信息进行特征编码；以及通过深度强化学习对人体行为过程中有效的部位进行筛选，以预测人的行为。2.根据权利要求1所述的基于深度强化学习的行为预测方法，其特征在于，所述通过视频图像的帧提取人体骨架信息的局部特征，进一步包括：通过人体姿态估计方法对所述视频图像的帧进行人体骨架的提取；在每一个关节点上选取备选框，以对所述备选框中的图像进行空域的特征提取得到所述人体骨架信息的局部特征。3.根据权利要求1所述的基于深度强化学习的行为预测方法，其特征在于，所述根据人体机构化信息进行特征编码，进一步包括：将所述人体骨架信息的动作特征根据人体骨架的顺序进行串联得到特征表示；针对每一个部位进行时域的池化，以得到动作表示；将所述视频图像的所有人的所有节点根据人的顺序串联得到视频在观测到的部分的动作。4.根据权利要求1所述的基于深度强化学习的行为预测方法，其特征在于，所述通过深度强化学习进行人体行为表达，进一步包括：将所述动作特征作为出示状态，并根据当前额状态确定当前所要采取的动作，以通过状态转移方程得到新的状态，直至状态稳定，停止循环。5.根据权利要求4所述的基于深度强化学习的行为预测方法，其特征在于，所述状态转移方程为：其中，为t时刻当前状态，λ为一个常系数用来调整两项之间的关系，为初始状态，为t-1时刻采取的动作，为t-1时刻的状态，ω为视频样本的序号，t为时间刻度。6.一种基于深度强化学习的行为预...

【专利技术属性】
技术研发人员：鲁继文，周杰，陈磊，段岳圻，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人