本发明专利技术公开了一种基于卷积神经网络的高清视频人脸对齐的方法,包括如下步骤:S1、处理过程的每个阶段分成以下步骤,这个过程会执行关键特征点的位置估计和全连接网络的下一阶段输入数据准备;S2、从最初的第一个阶段开始,之后经过n轮计算,每一轮都进一步微调上一轮得到最新关键特征点位置,通过可视化引入热图和特征图,我们在每一阶段都保持传递了关键信,本发明专利技术结构科学合理,使用安全方便,处理过程传承了整个视频连续帧的关键信息,相较于局部区域对齐处理的方法,能适应不同的头部姿态和初始形象,为其他高效高质量的业务人脸处理提供基础保证。
【技术实现步骤摘要】
一种基于卷积神经网络的高清视频人脸对齐的方法
本专利技术涉及人脸对齐
,具体为一种基于卷积神经网络的高清视频人脸对齐的方法。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一,卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络;近些年大部分的高清视频人脸对齐方法都和普通图片的识别方法类似,都是基于形状索引特征,在这类方法中图片特征或者经过机器学习转换得到特征都是从围绕着特征点区域片段中抽取计算得到的,然后这些特征被反复用在这些特征点位置的微调,这种方法在普通照片上可能还行,但在高清照片或者视频上其效率非常低下,并且效果也很差,这是因为在高清照片或者视频中获得这些片段无法给出足够的信息,导致信息不全面,所以往往会训练获得局部最优点,而不是整体最优点,这样带来的问题影响整个模型的效率和效果。
技术实现思路
本专利技术提供一种基于卷积神经网络的高清视频人脸对齐的方法,可以有效解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于卷积神经网络的高清视频人脸对齐的方法,包括如下步骤:S1、处理过程的每个阶段分成以下步骤,这个过程会执行关键特征点的位置估计和全连接网络的下一阶段输入数据准备;S2、从最初的第一个阶段开始,之后经过n轮计算,每一轮都进一步微调上一轮得到最新关键特征点位置,通过可视化引入热图和特征图,我们在每一阶段都保持传递了关键信息;S3、视频每一帧的关键特征点位置确定后,根据时间线拟合整个视频的连续帧的特征点的连续位置;S4、检验对齐全视频人脸关键点特征位置,输出用于各类该视频人脸处理用途。根据上述技术方案,所述S1中还包括如下步骤:a、在当前阶段,通过前馈神经网络的估值计算得到转换增量,并进一步计算得到帧图片转换矩阵和关键特征点转换矩阵;b、使用图片转换矩阵转换原始视频帧图片,得到这个执行阶段的转换过的视频帧图片;c、使用关键特征点转换矩阵转换当前阶段的关键特征点位置,得到这个执行阶段的转换过的关键特征点位置;d、通过计算步骤c中得到的特征点位置,得到当前步骤的可视化热图输出;e、通过当前执行阶段的全连接网络获得下个阶段所要使用的特征图;f、转换后的视频帧图片、热图和特征图都作为下一阶段要用到的输入,通过链接层进入下个阶段。与现有技术相比,本专利技术的有益效果:本专利技术结构科学合理,使用安全方便,本方法分成多个局部阶段,每个n+1阶段改进人脸关键点的位置都是基于第n个阶段,也就是上一个阶段,我们在所有阶段中,都用到了完整的人脸帧或图片,与只依赖于局部片段区域的识别方法有很大的区别,关键点热图提供了通过可是化的方式提供了方法中前序阶段所提取得到的关键点位置信息,这使得整个全画幅处理过程成为可能,因为保持使用整张脸的画幅,而不是局部特征位置片段,使得这个方法能够处理差异化很大的人脸视频帧或高清图片,比如头的摆放位置,高难度的起始状态等,这能够大幅降低人脸特征点提取与对齐过程中错误率。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1是本专利技术的方法步骤结构示意图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。实施例:如图1所示,本专利技术提供技术方案,一种基于卷积神经网络的高清视频人脸对齐的方法,包括如下步骤:S1、处理过程的每个阶段分成以下步骤,这个过程会执行关键特征点的位置估计和全连接网络的下一阶段输入数据准备;S2、从最初的第一个阶段开始,之后经过n轮计算,每一轮都进一步微调上一轮得到最新关键特征点位置,通过可视化引入热图和特征图,我们在每一阶段都保持传递了关键信息;S3、视频每一帧的关键特征点位置确定后,根据时间线拟合整个视频的连续帧的特征点的连续位置;S4、检验对齐全视频人脸关键点特征位置,输出用于各类该视频人脸处理用途。根据上述技术方案,S1中还包括如下步骤:a、在当前阶段,通过前馈神经网络的估值计算得到转换增量,并进一步计算得到帧图片转换矩阵和关键特征点转换矩阵;b、使用图片转换矩阵转换原始视频帧图片,得到这个执行阶段的转换过的视频帧图片;c、使用关键特征点转换矩阵转换当前阶段的关键特征点位置,得到这个执行阶段的转换过的关键特征点位置;d、通过计算步骤c中得到的特征点位置,得到当前步骤的可视化热图输出;e、通过当前执行阶段的全连接网络获得下个阶段所要使用的特征图;f、转换后的视频帧图片、热图和特征图都作为下一阶段要用到的输入,通过链接层进入下个阶段。与现有技术相比,本专利技术的有益效果:本专利技术结构科学合理,使用安全方便,本方法分成多个局部阶段,每个n+1阶段改进人脸关键点的位置都是基于第n个阶段,也就是上一个阶段,我们在所有阶段中,都用到了完整的人脸帧或图片,与只依赖于局部片段区域的识别方法有很大的区别,关键点热图提供了通过可是化的方式提供了方法中前序阶段所提取得到的关键点位置信息,这使得整个全画幅处理过程成为可能,因为保持使用整张脸的画幅,而不是局部特征位置片段,使得这个方法能够处理差异化很大的人脸视频帧或高清图片,比如头的摆放位置,高难度的起始状态等,这能够大幅降低人脸特征点提取与对齐过程中错误率。最后应说明的是:以上仅为本专利技术的优选实例而已,并不用于限制本专利技术,尽管参照前述实施例对本专利技术进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
【技术保护点】
1.一种基于卷积神经网络的高清视频人脸对齐的方法,其特征在于:包括如下步骤:/nS1、处理过程的每个阶段分成以下步骤,这个过程会执行关键特征点的位置估计和全连接网络的下一阶段输入数据准备;/nS2、从最初的第一个阶段开始,之后经过n轮计算,每一轮都进一步微调上一轮得到最新关键特征点位置,通过可视化引入热图和特征图,我们在每一阶段都保持传递了关键信息;/nS3、视频每一帧的关键特征点位置确定后,根据时间线拟合整个视频的连续帧的特征点的连续位置;/nS4、检验对齐全视频人脸关键点特征位置,输出用于各类该视频人脸处理用途。/n
【技术特征摘要】
1.一种基于卷积神经网络的高清视频人脸对齐的方法,其特征在于:包括如下步骤:
S1、处理过程的每个阶段分成以下步骤,这个过程会执行关键特征点的位置估计和全连接网络的下一阶段输入数据准备;
S2、从最初的第一个阶段开始,之后经过n轮计算,每一轮都进一步微调上一轮得到最新关键特征点位置,通过可视化引入热图和特征图,我们在每一阶段都保持传递了关键信息;
S3、视频每一帧的关键特征点位置确定后,根据时间线拟合整个视频的连续帧的特征点的连续位置;
S4、检验对齐全视频人脸关键点特征位置,输出用于各类该视频人脸处理用途。
2.根据权利要求1所述的一种基于卷积神经网络的高...
【专利技术属性】
技术研发人员:王梓鉴,孙伟,
申请(专利权)人:秒影工场北京科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。