基于视频的最优目标捕捉方法、装置及相关设备制造方法及图纸

技术编号：28943210 阅读：26 留言：0更新日期：2021-06-18 21:51

本发明专利技术实施例提供一种基于视频的最优目标捕捉方法，包括：从视频中获取一帧图像，所述图像包括至少一个待捕捉目标；基于所述图像，通过第一模型对所述待捕捉目标进行基础特征提取，得到所述待捕捉目标的基础特征；基于所述待捕捉目标的基础特征，通过第二模型提取所述待捕捉目标的多个属性特征，并通过第三模型对所述待捕捉目标的多个属性特征进行融合，得到属性融合特征；基于所述多个属性特征和所述属性融合特征，通过预构建评分函数对所述图像中的待捕捉目标进行质量评分，得到所述图像的质量分数；重复上述步骤，得到对应多帧图像的多个质量分数，并从中选出质量分数最高的一帧图像作为所述视频的最优目标。

全部详细技术资料下载

【技术实现步骤摘要】
基于视频的最优目标捕捉方法、装置及相关设备
本专利技术涉及人工智能领域，尤其涉及一种基于视频的最优目标捕捉方法、装置及相关设备。
技术介绍
近年来，随着人工智能领域中深度学习技术的发展以及相关硬件设备算力的提升，基于计算机视觉的应用在各个领域得到落地和进一步发展，例如安防领域，其中很多业务场景都需要在一段视频帧内捕捉到一个目标的最佳图片，比如基于视频的行人在线认证、跨摄像头的行人重识别等，又如警方在利用监控视频追踪犯罪嫌疑人时，需要对出现嫌疑人的摄像视频进行分析，获取嫌疑人最清晰的正面特征方便后续抓捕工作的开展。在现有技术中，传统判断目标是否为最优的方法只是通过网络输出的目标置信度进行判断，但是这样并不能确保目标就是最优的，比如目标背对时获得的置信度比正面时置信度更高，这就导致只能够保存目标的背对图像，难以准确从图像中获得最清晰、最大、正面的最优目标，导致后续业务场景无法高效使用。
技术实现思路
本专利技术实施例提供一种基于视频的最优目标捕捉方法，能够准确从视频图像中获取最优目标，以供后续业务场景...

【技术保护点】
1.一种基于视频的最优目标捕捉方法，其特征在于，包括以下步骤：/n从视频中获取一帧图像，所述图像包括至少一个待捕捉目标，所述待捕捉目标包括目标行人；/n基于所述图像，通过第一模型对所述待捕捉目标进行基础特征提取，得到所述待捕捉目标的基础特征；/n基于所述待捕捉目标的基础特征，通过第二模型提取所述待捕捉目标的多个属性特征，并通过第三模型对所述待捕捉目标的多个属性特征进行融合，得到属性融合特征；/n基于所述多个属性特征和所述属性融合特征，通过预构建评分函数对所述图像中的待捕捉目标进行质量评分，得到所述图像的质量分数；/n重复上述步骤，直到所述视频的最后一帧图像，得到对应多帧图像的多个质量分数，并从...

【技术特征摘要】
1.一种基于视频的最优目标捕捉方法，其特征在于，包括以下步骤：
从视频中获取一帧图像，所述图像包括至少一个待捕捉目标，所述待捕捉目标包括目标行人；
基于所述图像，通过第一模型对所述待捕捉目标进行基础特征提取，得到所述待捕捉目标的基础特征；
基于所述待捕捉目标的基础特征，通过第二模型提取所述待捕捉目标的多个属性特征，并通过第三模型对所述待捕捉目标的多个属性特征进行融合，得到属性融合特征；
基于所述多个属性特征和所述属性融合特征，通过预构建评分函数对所述图像中的待捕捉目标进行质量评分，得到所述图像的质量分数；
重复上述步骤，直到所述视频的最后一帧图像，得到对应多帧图像的多个质量分数，并从中选出质量分数最高的一帧图像作为所述视频的最优目标；
所述第三模型包括特征拼接层和特征融合层，所述通过第三模型对所述待捕捉目标的多个属性特征进行融合，得到属性融合特征的步骤，包括：
将所述目标行人的多个属性特征通过所述特征拼接层进行拼接，得到拼接特征；
将所述拼接特征通过所述特征融合层进行特征融合，得到属性融合特征。

2.如权利要求1所述的基于视频的最优目标捕捉方法，其特征在于，所述待捕捉目标的多个属性特征包括所述目标行人的多个属性特征，所述多个属性特征包括：目标行人朝向、目标行人遮挡比率、目标行人脸部遮挡比率以及目标行人站立状态。

3.如权利要求1所述的基于视频的最优目标捕捉方法，其特征在于，所述第一模型包括标准卷积结构和特征降维结构，所述标准卷积结构包括二维卷积层、归一化层和激活层；所述特征降维结构包括分组卷积层、标准卷积层、平均池化层和二维卷积层。

4.如权利要求1所述的基于视频的最优目标捕捉方法，其特征在于，所述第二模型包括对应所述待捕捉目标的多个属性特征的多个属性特征提取模块，每个所述属性特征提取模块从所述目标行人的基础特征中提取出一个目标行人属性特征；每个所述属性特征提取模块包括一个标准卷积结构和两个特征降维结构。

5.如权利要求1所述的基于视频的最优目标捕捉方法，其特征在于，所述评分函数的预构建包括以下步骤：
根据业务场景确定每个目标行人属性特征的位置；
确定每个目标行人属性特征的权重；
基于每个目标行人属性特征的位置和权重得到所述评分函数。

6.如权利要求1所述的基于视频的最优目标捕捉方法，其...

【专利技术属性】
技术研发人员：张松华，闫潇宁，郑双午，
申请(专利权)人：深圳市安软科技股份有限公司，深圳市安软慧视科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人