一种语音动画生成方法及系统技术方案

技术编号：4188841 阅读：221 留言：0更新日期：2012-04-11 18:40

本发明专利技术实施例提供一种语音动画生成方法及系统。一种语音动画生成方法的实施例，包括：在面部图像上生成面部图像特征点；根据面部图像特征点独立构造变形前面部图像的横向样条和纵向样条；从音频数据中获取语音动画参数；根据语音动画参数获取变形后面部图像的横向样条和纵向样条；根据变形前的横向样条和变形后的横向样条通过扫描线计算变形前的横向样条间像素点移动的第一位移以及根据变形前的纵向样条和变形后的纵向样条通过扫描线计算变形前的纵向样条间像素点的第二位移，根据所述第一位移和所述第二位移生成变形后的面部图像。本发明专利技术实施例降低语音动画技术中图像变形算法的运算复杂性，使得语音动画技术中语音控制动画生成的实时性增强。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，特别涉及一种语音动画生成方法及系统。
技术介绍
自然语言和肢体语言是人类相互交流的主要方式。在肢体语言中，人脸是人类相互交流的重要渠道，因此语音和人脸是人类相互交流的两种最重要的渠道。语音动画技术就是将人脸动画技术与语音处理技术相结合，用计算机生成语音与口型同步播出的动画技术，也称为“说话的头像”或“对口型”。语音动画技术包括基于单幅图像的语音动画技术。基于单幅图像的语音动画技术的工作流程为输入一张人脸图像，在所述人脸图像上自动或手工标记特征点，保存成面部特征点的位置数据文件；输入语音文件，对所述语音文件进行语音识别，生成音素_时间戳文件并保存；根据所述语音文件的音素_时间戳文件对所述人脸图像采用图像变形技术实现人脸图像的变形，达到变形图像与语音文件的同步，使得一边播放语音，一边驱动图像上的人脸进行动画。基于单幅图像的语音动画技术还可应用于动物脸图像或卡通形象的脸图像。在基于单幅图像的语音动画技术中，图像变形技术是其核心技术。现有的图像变形技术一般采用基于网格扭曲的图像变形算法。基于网格扭曲的图像变形算法通过对面部图像进行网格划分，形成一张网状的面罩，再对面部图像进行图像变形，产生人脸动画。基于网格扭曲的图像变形算法主要用于两张面部图像之间的形状变形，两张面部图像分别为源图像Is和目标图像Ιτ。其中，源图像 Is与网格Ms相对应，目标图像It与网格Mt相对应；如图1所述，网格Ms指定了控制点的坐标，网格Mt指定了网格Ms中控制点在目标图像It中的对应位置。网格Ms和网格Mt —起用于定义空间转...

【技术保护点】
一种语音动画生成方法，其特征在于，包括：在面部图像上生成面部图像特征点；根据所述面部图像特征点独立构造变形前面部图像的横向样条和纵向样条；从音频数据中获取语音动画参数；根据所述语音动画参数获取变形后面部图像的横向样条和纵向样条；根据所述变形前的横向样条和所述变形后的横向样条通过扫描线计算所述变形前的横向样条间像素点移动的第一位移，根据所述变形前的纵向样条和所述变形后的纵向样条通过扫描线计算所述变形前的纵向样条间像素点移动的第二位移，根据所述第一位移和所述第二位移生成变形后的面部图像。

【技术特征摘要】

【专利技术属性】
技术研发人员：董兰芳，倪奎，王亚涛，覃景繁，
申请(专利权)人：华为技术有限公司，中国科学技术大学，
类型：发明
国别省市：94[中国|深圳]

全部详细技术资料下载我是这个专利的主人