用于生成嘴唇动作视频的方法和装置制造方法及图纸

技术编号：22330211 阅读：50 留言：0更新日期：2019-10-19 12:17

本申请实施例公开了用于生成嘴唇动作视频的方法和装置。该方法的一具体实施方式包括：获取目标文本；确定目标文本的每个发音单元对应的嘴唇关键点序列；基于每个发音单元对应的嘴唇关键点序列，生成目标文本对应的嘴唇关键点序列；将目标文本对应的嘴唇关键点序列输入至预先训练的图像合成网络，得到目标文本对应的嘴唇动作图像序列；拼接目标文本对应的嘴唇动作图像序列，生成目标文本对应的嘴唇动作视频。该实施方式提高了生成嘴唇动作视频的效率。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成嘴唇动作视频的方法和装置
本申请实施例涉及计算机
，具体涉及用于生成嘴唇动作视频的方法和装置。
技术介绍
嘴唇动作视频生成技术是用计算机技术合成指定内容、时间上完全对应、自然流畅的嘴唇动作视频。目前，常用的嘴唇动作视频生成方式是录制所有可能的发音单元对应的嘴唇动作视频，将待合成的句子拆分为发音单元的序列，将每个发音单元对应的嘴唇动作视频按照指定的时间进行缩放，拼接合成嘴唇动作视频。
技术实现思路
本申请实施例提出了用于生成嘴唇动作视频的方法和装置。第一方面，本申请实施例提供了一种用于生成嘴唇动作视频的方法，包括：获取目标文本；确定目标文本的每个发音单元对应的嘴唇关键点序列；基于每个发音单元对应的嘴唇关键点序列，生成目标文本对应的嘴唇关键点序列；将目标文本对应的嘴唇关键点序列输入至预先训练的图像合成网络，得到目标文本对应的嘴唇动作图像序列；拼接目标文本对应的嘴唇动作图像序列，生成目标文本对应的嘴唇动作视频。在一些实施例中，该方法还包括：利用语音合成技术合成目标文本对应的语音；将目标文本对应的语音融合进目标文本对应的嘴唇动作视频。在一些实施例中，确定目标文本的每个发音单元对应的嘴唇关键点序列，包括：获取目标人物预先录制的连续语句的嘴唇动作视频和每个发音单元的原始嘴唇动作视频；对于每个发音单元，确定连续语句的嘴唇动作视频中与该发音单元的原始嘴唇动作视频相似的嘴唇动作视频片段对应的嘴唇关键点序列，生成该发音单元对应的候选嘴唇关键点序列集合；从该发音单元对应的候选嘴唇关键点序列集合中确定该发音单元对应的嘴唇关键点序列。在一些实施例中，确定连续语句的嘴唇动作...

【技术保护点】
1.一种用于生成嘴唇动作视频的方法，包括：获取目标文本；确定所述目标文本的每个发音单元对应的嘴唇关键点序列；基于每个发音单元对应的嘴唇关键点序列，生成所述目标文本对应的嘴唇关键点序列；将所述目标文本对应的嘴唇关键点序列输入至预先训练的图像合成网络，得到所述目标文本对应的嘴唇动作图像序列；拼接所述目标文本对应的嘴唇动作图像序列，生成所述目标文本对应的嘴唇动作视频。

【技术特征摘要】
1.一种用于生成嘴唇动作视频的方法，包括：获取目标文本；确定所述目标文本的每个发音单元对应的嘴唇关键点序列；基于每个发音单元对应的嘴唇关键点序列，生成所述目标文本对应的嘴唇关键点序列；将所述目标文本对应的嘴唇关键点序列输入至预先训练的图像合成网络，得到所述目标文本对应的嘴唇动作图像序列；拼接所述目标文本对应的嘴唇动作图像序列，生成所述目标文本对应的嘴唇动作视频。2.根据权利要求1所述的方法，其中，所述方法还包括：利用语音合成技术合成所述目标文本对应的语音；将所述目标文本对应的语音融合进所述目标文本对应的嘴唇动作视频。3.根据权利要求1所述的方法，其中，所述确定所述目标文本的每个发音单元对应的嘴唇关键点序列，包括：获取目标人物预先录制的连续语句的嘴唇动作视频和每个发音单元的原始嘴唇动作视频；对于每个发音单元，确定所述连续语句的嘴唇动作视频中与该发音单元的原始嘴唇动作视频相似的嘴唇动作视频片段对应的嘴唇关键点序列，生成该发音单元对应的候选嘴唇关键点序列集合；从该发音单元对应的候选嘴唇关键点序列集合中确定该发音单元对应的嘴唇关键点序列。4.根据权利要求3所述的方法，其中，所述确定所述连续语句的嘴唇动作视频中与该发音单元的原始嘴唇动作视频相似的嘴唇动作视频片段对应的嘴唇关键点序列，生成该发音单元对应的候选嘴唇关键点序列集合，包括：对所述连续语句的嘴唇动作视频进行嘴唇关键点提取，得到所述连续语句的嘴唇关键点序列；对该发音单元的原始嘴唇动作视频进行嘴唇关键点提取，得到该发音单元的原始嘴唇关键点序列；从所述连续语句的嘴唇关键点序列中确定与该发音单元的原始嘴唇关键点序列相似的嘴唇关键点序列，生成该发音单元对应的候选嘴唇关键点序列集合。5.根据权利要求4所述的方法，其中，所述从所述连续语句的嘴唇关键点序列中确定与该发音单元的原始嘴唇关键点序列相似的嘴唇关键点序列，包括：基于该发音单元的原始嘴唇关键点序列中的原始嘴唇关键点和所述连续语句的嘴唇关键点序列中的嘴唇关键点，确定与该发音单元的原始嘴唇关键点序列相似的嘴唇关键点序列的结束位置；基于与该发音单元的原始嘴唇关键点序列相似的嘴唇关键点序列的结束位置进行路径回溯，确定与该发音单元的原始嘴唇关键点序列相似的嘴唇关键点序列。6.根据权利要求3所述的方法，其中，所述从该发音单元对应的候选嘴唇关键点序列集合中确定该发音单元对应的嘴唇关键点序列，包括：计算该发音单元对应的每个候选嘴唇关键点序列与该发音单元的相邻发音单元对应的每个候选嘴唇关键点序列的相似度；基于所计算的相似度，确定该发音单元对应的嘴唇关键点序列的结束位置；基于该发音单元对应的嘴唇关键点序列的结束位置进行路径回溯，确定该发音单...

【专利技术属性】
技术研发人员：龙翔，李鑫，刘霄，赵翔，王平，李甫，张赫男，孙昊，文石磊，丁二锐，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人