一种基于视频图像的内容识别方法技术

技术编号:22220134 阅读:32 留言:0更新日期:2019-09-30 01:54
一种基于视频图像的内容识别方法,本发明专利技术属于人工智能领域,具体涉及一种视频图像识别方法。本发明专利技术的目的为了解决现有基于视频内容的识别实时性不佳的问题。本发明专利技术首先构建图像识别网络模型,然后针对视频图像,提取关键帧图像;利用图像识别网络模型对关键帧图像进行处理,确定图像的内容对象;同时通过光流法计算出两帧图像间的光流场信息,将关键帧的特征传输到其他帧图像;然后对模型进行训练,得到训练好的最终识别模型;利用训练好的最终识别模型对视频图像的内容进行识别。本发明专利技术用于视频图像的内容识别。

A Content Recognition Method Based on Video Image

【技术实现步骤摘要】
一种基于视频图像的内容识别方法
本专利技术属于人工智能领域,具体涉及一种视频图像识别方法。
技术介绍
随着科技的逐步发展,自动驾驶技术、机器人技术等发展越来越快,技术相应越来越成熟,无轮是自动驾驶
还是机器人
等,想要实现自主识别并自主判断一般都是基于图像进行处理的,尤其是针对于自动驾驶和机器人的自主识别(运动过程中的避碰等)等大部分是基与视频图像进行处理的。但是目前的视频图像处理有着一定缺点:视频的数据量庞大,不仅对于图像采集和图像处理等硬件有着非常高的要求,对于处理的软件环境也有着较高的要求,导致现有硬件或软件处理速度较慢,不能满足实时性的要求。尤其是针对于自动驾驶技术而言,对实时性判断的要求极高,如果不能满足实时性的要求,则无法保证行车安全,如果为了保证实时性的要求,那么就可能需要牺牲图像精度为代价,这样便降低了内容识别的准确性或这导致误报率升高,对行车安全同样存在着极大的安全隐患。同时这也是制约着对实时性有要求的机器人等领域的发展。
技术实现思路
本专利技术的目的为了解决现有基于视频内容的识别实时性不佳的问题。一种基于视频图像的内容识别方法,包括以下步骤:步骤1、构建本文档来自技高网...

【技术保护点】
1.一种基于视频图像的内容识别方法,其特征在于,包括以下步骤:步骤1、构建图像识别网络模型:所述的图像识别网络模型的结构为:输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一特征拼接层、第二特征拼接层、输出层;所述第一特征拼接层拼接对第三池化层的特征图与第二池化层特征图进行特征拼接,然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理,将特征信息输入第二特征拼接层;第二特征拼接层将第一特征拼接层输入的特征图与第一池化层特征图进行特征拼接,然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理,将深度特征信息输入输出层;步骤2、针对视频图像...

【技术特征摘要】
1.一种基于视频图像的内容识别方法,其特征在于,包括以下步骤:步骤1、构建图像识别网络模型:所述的图像识别网络模型的结构为:输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一特征拼接层、第二特征拼接层、输出层;所述第一特征拼接层拼接对第三池化层的特征图与第二池化层特征图进行特征拼接,然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理,将特征信息输入第二特征拼接层;第二特征拼接层将第一特征拼接层输入的特征图与第一池化层特征图进行特征拼接,然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理,将深度特征信息输入输出层;步骤2、针对视频图像,提取关键帧图像;利用图像识别网络模型对关键帧图像进行处理,确定图像的内容对象;同时通过光流法计算出两帧图像间的光流场信息,将关键帧的特征传输到其他帧图像;步骤3、针对步骤2的模型进行训练,得到训练好的最终识别模型;...

【专利技术属性】
技术研发人员:孙绍辉曹勇田云龙孙绍光
申请(专利权)人:黑龙江电力调度实业有限公司
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1