实时视频的处理方法、装置、设备及存储介质制造方法及图纸

技术编号：25643835 阅读：29 留言：0更新日期：2020-09-15 21:35

本申请公开了一种实时视频的处理方法、装置、设备及存储介质，涉及数字图像处理、深度学习技术领域。具体实现方案为：将视频帧加入至视频帧集合中，并从视频帧集合中获取当前处理帧；将当前处理帧输入至人脸风格转换模型中，获取模型输出的第一类风格变换帧；以当前处理帧和第一类风格变换帧为起点，根据视频帧集合中设定数量的后续视频帧与前一视频帧中各人脸关键点间的位置关系，生成对应的第二类风格变换帧；从视频帧集合中获取新的当前处理帧后，返回执行将当前处理帧输入至人脸风格转换模型中的操作，并将第一类风格变换帧和第二类风格变换帧作为实时视频处理结果。本申请实施例的技术方案可以基于视频中的真实人脸实时生成匹配的风格人脸。

全部详细技术资料下载

【技术实现步骤摘要】
实时视频的处理方法、装置、设备及存储介质
本申请实施例涉及图像处理、深度学习技术，尤其涉及数字图像处理技术，具体涉及一种实时视频的处理方法、装置、设备及存储介质。
技术介绍
随着生活水平的不断提高，用户对娱乐化的需求越来越多样化，将视频中的真实人脸变换成动漫风格人脸也受到越来越多用户的关注和喜爱。现有技术中，通常在离线状态下，基于视频中的真实人脸生成匹配的风格人脸，或者，使用视频中的真实人脸实时驱动一个已经预先生成的固定风格人脸，生成与真实人脸表情一致的风格人脸。但这两种方式都不能基于视频中的真实人脸，实时生成与该真实人脸匹配的风格人脸。
技术实现思路
本申请实施例提供了一种实时视频的处理方法、装置、设备及存储介质，实现了基于视频中的真实人脸，实时生成与真实人脸匹配的风格人脸。第一方面，本申请实施例提供了一种实时视频的处理方法，包括：将实时采集的视频帧加入至视频帧集合中，并从视频帧集合中获取当前处理帧，视频帧中包括真实人脸；将当前处理帧输入至人脸风格转换模型中，并获取人脸风格转换模型输出的第一类风格变换帧，风格变换帧中包括风格人脸；以当前处理帧和第一类风格变换帧为起点，根据视频帧集合中设定数量的后续视频帧与前一视频帧中各人脸关键点间的位置关系，生成所述设定数量的第二类风格变换帧；从视频帧集合中获取新的当前处理帧后，返回执行将当前处理帧输入至人脸风格转换模型中的操作，并将第一类风格变换帧和第二类风格变换帧作为实时视频处理结果。第二方面，...

【技术保护点】
1.一种实时视频的处理方法，包括：/n将实时采集的视频帧加入至视频帧集合中，并从视频帧集合中获取当前处理帧，视频帧中包括真实人脸；/n将当前处理帧输入至人脸风格转换模型中，并获取人脸风格转换模型输出的第一类风格变换帧，风格变换帧中包括风格人脸；/n以当前处理帧和第一类风格变换帧为起点，根据视频帧集合中设定数量的后续视频帧与前一视频帧中各人脸关键点间的位置关系，生成所述设定数量的第二类风格变换帧；/n从视频帧集合中获取新的当前处理帧后，返回执行将当前处理帧输入至人脸风格转换模型中的操作，并将第一类风格变换帧和第二类风格变换帧作为实时视频处理结果。/n

【技术特征摘要】
1.一种实时视频的处理方法，包括：
将实时采集的视频帧加入至视频帧集合中，并从视频帧集合中获取当前处理帧，视频帧中包括真实人脸；
将当前处理帧输入至人脸风格转换模型中，并获取人脸风格转换模型输出的第一类风格变换帧，风格变换帧中包括风格人脸；
以当前处理帧和第一类风格变换帧为起点，根据视频帧集合中设定数量的后续视频帧与前一视频帧中各人脸关键点间的位置关系，生成所述设定数量的第二类风格变换帧；
从视频帧集合中获取新的当前处理帧后，返回执行将当前处理帧输入至人脸风格转换模型中的操作，并将第一类风格变换帧和第二类风格变换帧作为实时视频处理结果。

2.根据权利要求1所述的方法，其中，以当前处理帧和第一类风格变换帧为起点，根据视频帧集合中设定数量的后续视频帧与前一视频帧中各人脸关键点间的位置关系，生成所述设定数量的第二类风格变换帧，包括：
将当前处理帧作为处理起点帧，在视频帧集合中，获取处理起点帧的后一视频帧；
根据后一视频帧与处理起点帧中各人脸关键点分别在对应视频帧中的图像位置，生成人脸关键点变换矩阵；
根据人脸关键点变换矩阵，和与处理起点帧匹配的第一类风格变换帧或第二类风格变换帧，生成后一视频帧的第二类风格变换帧；
将所述后一视频帧作为处理起点帧，返回执行在视频帧集合中，获取处理起点帧的后一视频帧的操作，直至后一视频帧的处理数量达到所述设定数量。

3.根据权利要求1所述的方法，在将当前处理帧输入至人脸风格转换模型中之前，还包括：
获取训练样本集，训练样本集中的包括多个样本图像对，每个样本图像对中包括原始图像以及变换后图像；
使用训练样本集中各样本图像对训练设定机器学习模型，得到所述人脸风格转换模型；
其中，所述原始图像中包括真实人脸，所述变换后图像中包括与真实人脸匹配的风格人脸。

4.根据权利要求3所述的方法，其中，所述机器学习模型包括：生成对抗网络。

5.根据权利要求1-4任一项所述的方法，其中，将实时采集的视频帧加入至视频帧集合中，包括：
在视频录制过程中，响应于人脸风格变换请求，将实时采集的视频帧加入至视频帧集合中；
其中，将第一类风格变换帧和第二类风格变换帧作为实时视频处理结果，包括：
对第一类风格变换帧和第二类风格变换帧进行实时录制播放，并生成录制视频。

6.根据权利要求5所述的方法，其中，对第一类风格变换帧和第二类风格变换帧进行实时录制播放，包括：
将实时生成的第一类风格变换帧和第二类风格变换帧顺序存储于设定缓存队列中；
当所述缓存队列中满足预设的硬延时条件时，从所述缓存队列中顺序获取第一类风格变换帧，或者第二类风格变换帧，进行实时录制播放。

7.根据权利要求1-4任一项所述的方法，其中，将实时采集的视频帧加入至视频帧集合中，包括：
在视频直播过程中，响应于人脸风格变换请求，将实时采集的视频帧加入至视频帧集合中；
其中，将第一类风格变换帧和第二类风格变换帧作为实时视频处理结果，包括：
根据第一类风格变换帧和第二类风格变换帧，生成直播视频流，并将直播视频流发送至直播服务器，以进行视频直播。

8.根据权利要求7所述的方法，其中，根据第一类风格变换帧和第二类风格变换帧，生成直播视频流，并将直播视频流发送至直播服务器，包括：
将实时生成的第一类风格变换帧和第二类风格变换帧顺序存储于设定缓存队列中；
当所述缓存队列中满足预设的硬延时条件时，从所述缓存队列中顺序获取第一类风格变换帧，或者第二类风格变换帧，生成直播视频流，并将直播视频流发送至直播服务器。

9.一种实时视频的处理装置，包括：
获取模块，用于将实时采集的视频帧加入至视频帧集合中，并从视频帧集合中获取当前处理帧，视频帧中包括真实人脸；
第...

【专利技术属性】
技术研发人员：李鑫，李甫，林天威，何栋梁，张赫男，孙昊，文石磊，丁二锐，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人