基于表情驱动的虚拟视频合成方法、装置及存储介质制造方法及图纸

技术编号：22946348 阅读：27 留言：0更新日期：2019-12-27 17:30

本发明专利技术涉及视频合成技术领域，提出一种基于表情驱动的虚拟视频合成方法、装置及存储介质，所述方法包括：获取待合成图像集，并从所述待合成图像集中确定待合成图像；基于GAN网络对待合成图像与目标图像进行合成，形成目标照片，目标图像为用户原始图像；截取未经处理的原始视频中的多个帧作为基准图像；基于所述基准图像对所述目标照片进行表情驱动，得到与待传输虚拟传输视频对应的传输图像；对所述传输图像的帧进行拼合，形成所述虚拟合成视频。本发明专利技术采用自己的照片和陌生人的照片合成用于视频聊天的照片，进而通过表情驱动将合成的照片虚拟为与自己相似的视频，能够接近自己的真是容貌且能够保护自己的隐私。

Virtual video synthesis method, device and storage medium based on expression driven

全部详细技术资料下载

【技术实现步骤摘要】
基于表情驱动的虚拟视频合成方法、装置及存储介质
本专利技术涉及视频合成
，尤其涉及一种基于表情驱动的虚拟视频合成方法、装置及计算机可读存储介质。
技术介绍
目前，虚拟视频的合成在很多领域均得到广泛应用，具有很大的市场。由此兴起的虚拟社交是虚拟实现领域的一个重要应用，虚拟对象驱动，可以被应用在虚拟社交中，用来驱动个性化的角色，从而增强虚拟社交的真实性与互动性，优化用户的虚拟现实体验。但现有的虚拟视频合成主要是在电影、动画以及游戏视频制作中使用人脸动作捕捉设备来跟踪真实人脸的变化，并将其映射到一个虚拟角色上，用来驱动虚拟角色的口型以及表情，其并不能实现与自身脸部特征相似的虚拟视频合成。同样，在目前的社交领域中，普遍存在陌生人之间相互视频聊天的情况，如何在这种情况下选用与自己长相接近且不属于自己真实面容的视频进行聊天，也是目前急需要解决的一个技术问题。
技术实现思路
本专利技术提供一种基于表情驱动的虚拟视频合成方法、电子装置及计算机可读存储介质，其主要目的在于采用自己的照片和陌生人的照片合成用于视频聊天的照片，进而通过表情驱动将合成的照片虚拟为与自己相似的视频，能够接近自己的真是容貌且能够保护自己的隐私。为实现上述目的，本专利技术提供一种基于表情驱动的虚拟视频合成方法，应用于电子装置，所述方法包括：获取待合成图像集，并从所述待合成图像集中确定待合成图像；基于GAN网络对所述待合成图像与目标图像进行合成，形成目标照片，所述目标图像为用户原始图像；截取未...

【技术保护点】
1.一种基于表情驱动的虚拟视频合成方法，应用于电子装置，其特征在于，所述方法包括：/n获取待合成图像集，并从所述待合成图像集中确定待合成图像；/n基于GAN网络对所述待合成图像与目标图像进行合成，形成目标照片，所述目标图像为用户原始图像；/n截取未经处理的原始视频中的多个帧图像作为基准图像；/n基于所述基准图像对所述目标照片进行表情驱动，得到与待传输虚拟传输视频对应的传输图像；/n对所述传输图像的帧进行拼合，形成所述虚拟合成视频。/n

【技术特征摘要】
1.一种基于表情驱动的虚拟视频合成方法，应用于电子装置，其特征在于，所述方法包括：
获取待合成图像集，并从所述待合成图像集中确定待合成图像；
基于GAN网络对所述待合成图像与目标图像进行合成，形成目标照片，所述目标图像为用户原始图像；
截取未经处理的原始视频中的多个帧图像作为基准图像；
基于所述基准图像对所述目标照片进行表情驱动，得到与待传输虚拟传输视频对应的传输图像；
对所述传输图像的帧进行拼合，形成所述虚拟合成视频。

2.根据权利要求1所述的基于表情驱动的虚拟视频合成方法，其特征在于，所述待合成图像集中包含多组图像，每组图像包括同一人的多个表情图像，所述多个表情图像作为所述待合成图像的表情基。

3.根据权利要求2所述的基于表情驱动的虚拟视频合成方法，其特征在于，
所述目标图像为与所述待合成图像的表情基对应的一组图像；
对所述待合成图像与目标图像进行合成的步骤包括：将所述目标图像与所述待合成图像中的同一表情的图像进行合成，且合成后的目标照片的表情与所述待合成图像中的同一表情的图像的表情相一致。

4.根据权利要求1所述的基于表情驱动的虚拟视频合成方法，其特征在于，所述基于所述基准图像对所述目标照片进行表情驱动，得到与待传输虚拟传输视频对应的传输图像的步骤包括：
设定一个平均脸、一组表情基以及一组身份基；
将所述平均脸和所述身份基的系数设定为固定值，并控制所述目标照片的表情基系数随所述基准图像的表情基的系数变化而变化，形成与所述基准图像对应的传输图像。

5.根据权利要求4所述的基于表情驱动的虚拟视频合成方法，其特征在于，所述将所述平均脸和所述身份基的系数设定为固定值，并控制所述目标照片的表情基系数随所述基准图像的表情基的系数变化而变化，形成与所述基准图像对应的传输图像的步骤包括：
将所述平均脸、表情基和身份基的3D网格图转换为对应的2D图像，并基于所述2D图像获取对应的人脸关键点坐标；
获取所述基准图像的人脸关键点坐标；
通过迭代，改变表情基的系数，使基于所述2D图像获取的人脸关键点坐标与所述基准图像的人脸关键点坐标之间的欧式距离最小，从而确定一组表情基的系数；
将获取的表情基的系数应用至所述目标照片上，使得相同表情基的系数相同，获取最...

【专利技术属性】
技术研发人员：孙太武，张艳，周超勇，刘玉宇，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人