【技术实现步骤摘要】
光流生成装置和方法
本专利技术涉及计算机视觉
,特别是涉及一种光流生成装置。本专利技术还涉及一种光流生成方法。
技术介绍
在对运动物体进行拍摄或者拍摄体本身进行运动时对外部环境进行拍摄的过程中,会形成连续的帧图像,对于帧图像中的运动物体,由于运动物体的实际位置会随着时间的变化而变化,而帧图像则是按时间先后顺序排列,故运动物体在帧图像中的位置也会不断变化,光流就是指运动物体对应的图像在不同帧图像中的位置的变化;也能表述为:在计算机视觉中,光流定义图像中对象的移动,这个移动可以是相机移动或者物体移动引起的。具体是指,视频图像的一帧中的代表同一对象(物体)像素点移动到下一帧的移动量,使用二维向量表示。而光流生成装置则能根据计算出帧图像中的运动物体的光流并对运动物体的未来位置进行预测。通过光流计算,能实现动作捕捉、动作预测、物体跟踪和动作识别等。现有光流生成方法包括直接计算光流,直接计算光流主要是采用卢卡斯-金出(Lucas-Kanade,L-K),这个方法是由BruceD.Lucas和TakeoKanade专利技术的。它假设光流在像素点的邻域是一个常数,然后使用最小二乘法对邻域中的所有像素点求解基本的光流方程。直接计算光流的计算量较大,速度较慢。随着深度学习技术的发展并广泛地应用于计算机视觉等人工智能领域,也开始采用卷积神经网络(CNN)来解决光流估计问题,用于计算光流的CNN最初网络结构为FlowNet,改进版本为FowNet2.0。现有技术中普遍采用FlowNet2.0来计算光流。Flow ...
【技术保护点】
1.一种光流生成装置,其特征在于,包括:生成对抗网络;/n所述生成对抗网络包括第一生成器和判别器;/n所述第一生成器包括第一神经网络,所述第一生成器输入两帧图像,输出对应的第一预测光流;/n所述第一生成器的输出端连接所述判别器的输入端;/n所述判别器包括第二神经网络,所述判别器输入两帧图像和光流,所述判别器输入的光流包括训练集对应的样本光流或第一预测光流;所述样本光流为真实光流,所述判别器用于判断所述第一预测光流的真实性;当所述判别器输入的光流为所述第一预测光流,所述判别器的输出判定所述判别器输入的光流为所述样本光流时,所述判别器认为所述第一预测光流等同于所述样本光流;/n所述第一生成器的所述第一神经网络的权重参数通过训练得到,当所述判别器认为所述第一预测光流等同于所述样本光流时,所述第一生成器的训练完成。/n
【技术特征摘要】
1.一种光流生成装置,其特征在于,包括:生成对抗网络;
所述生成对抗网络包括第一生成器和判别器;
所述第一生成器包括第一神经网络,所述第一生成器输入两帧图像,输出对应的第一预测光流;
所述第一生成器的输出端连接所述判别器的输入端;
所述判别器包括第二神经网络,所述判别器输入两帧图像和光流,所述判别器输入的光流包括训练集对应的样本光流或第一预测光流;所述样本光流为真实光流,所述判别器用于判断所述第一预测光流的真实性;当所述判别器输入的光流为所述第一预测光流,所述判别器的输出判定所述判别器输入的光流为所述样本光流时,所述判别器认为所述第一预测光流等同于所述样本光流;
所述第一生成器的所述第一神经网络的权重参数通过训练得到,当所述判别器认为所述第一预测光流等同于所述样本光流时,所述第一生成器的训练完成。
2.如权利要求1所述的光流生成装置,其特征在于:在训练阶段,所述第一生成器输入的两帧图像和所述判别器输入的两帧图像相同且为训练集中的样本对应的两帧图像,所述两帧图像为在时间上具有前后顺序的连续两帧图像;
所述光流为不同时间上的所述两帧图像中的物体在所述两帧图像中形成的位移。
3.如权利要求2所述的光流生成装置,其特征在于:所述生成对抗网络还包括用于训练所述第一生成器的第一损失函数模块,在训练所述第一生成器时,所述第一损失函数模块输入所述第一预测光流和对应的所述样本光流,所述第一损失函数模块输出端输出所述第一预测光流和对应的所述样本光流形成的第一损失函数,所述第一生成器根据所述第一损失函数训练所述第一神经网络的权重参数。
4.如权利要求1所述的光流生成装置,其特征在于:所述判别器的第二神经网络的权重参数通过训练得到,所述生成对抗网络还包括用于训练所述判别器的第二损失函数模块。
5.如权利要求1所述的光流生成装置,其特征在于:所述第二神经网络的网络结构包括Resnet-50,Flownet2.0,mobilenet,densenet,inception。
6.一种光流生成方法,其特征在于:采用生...
【专利技术属性】
技术研发人员:康燕斌,张志齐,
申请(专利权)人:上海依图网络科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。