一种基于综合加权算法的口型动画合成方法技术

技术编号：11061858 阅读：214 留言：0更新日期：2015-02-19 08:55

一种基于综合加权算法的口型动画合成方法，包括如下步骤：针对输入的汉语文本进行分析，将汉字拆分为不同的汉语可视化音素，并将这些因素发送到语音合成系统合成为基本的可视化音素流，基于MPEG-4标准建立具有真实感的参数人脸模型，使用可视化音素动画帧参数驱动模型的形变，添加背景图像和对噪声的分层次处理和添加，实现了生动、真实，效果好的口型动画合成。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人脸表情动画研究领域，更具体地说涉及到口型与语音匹配的口型动画合成研究领域。
技术介绍
随着计算机动画技术的不断进步，人们对人机交互中口型动画的要求越来越高。但是，汉语口型动画的发展相对比较落后。一方面由于口型动画是一个多学科交叉的研究方向，包括了人机交互、计算机图形学、语音语言学等，而相关学科的发展不均衡，使得构建一个逼真的、高自动化程度口型动画系统仍是一个极富挑战性的研究课题。另一方面，世界上有四分之一的人说汉语，汉语口型动画系统具有极其广阔的应用市场，但是由于汉语本身所具有的复杂性，使得目前针对汉语的语音口型动画系统的研究相对较少，发展也相对滞后，尤其是国内学者的研究工作仍处于刚起步阶段，缺乏理论积累与技术积淀，导致了能够实现汉语口型动画设计的软件很少，而比较著名的口型动画设计软件如Poser 口型大师 Mimic、3ds max插件Voice-O-Matic等，都主要针对英文语言，对汉语支持性较差。针对英语口型动画研究，先后出现了协同发音模型，文本驱动、语音驱动以及混合驱动的方法，Guiard-Marigny等人提出了一种基于语音和图像共同作用驱动合成口型动画的方法，Bregler等人提出了 videoRewrite方法，该方法利用计算机视觉跟踪说话人嘴唇的特征点，并利用变形技术将这些嘴唇姿态组合成最终的口型动画序列，Kang Liu与Jorn. Osterman提出英文中口型与字母音位的对应关系，并在MPEG-4动画标准的基础上建立脸部、口型动画合成的算法。针对汉语口型动...
一种<a href="http://www.xjishu.com/zhuanli/55/201410712164.html" title="一种基于综合加权算法的口型动画合成方法原文来自X技术">基于综合加权算法的口型动画合成方法</a>

【技术保护点】
一种基于综合加权算法的口型动画合成方法，其特征在于，依次包括以下步骤：步骤1：输入汉语文本，针对输入的汉语文本进行分析，将汉字拆分为不同的汉语可视化音素，并将这些因素发送到语音合成系统合成为基本的可视化音素流；步骤2：基于MPEG‑4标准建立具有真实感的参数人脸模型，使用可视化音素动画帧参数驱动模型的形变，实现人脸口型动画；步骤3：从输入汉语文本中获得与输入汉语文本同步的输入背景噪声，对输入背景噪声进行分析，进行输入背景噪声平滑处理，得到初始输入背景噪声；步骤4：从汉字拆分为不同的汉语可视化音素中分别提取音素拆分后的音素输入背景噪声，对音素输入背景噪声进行分析，进行音素输入背景噪声平滑处理，得到初始音素输入背景噪声；步骤5：利用得到的初始音素输入背景噪声，对得到的初始输入背景噪声进行校正，得到校正后的输入背景噪声；步骤6：基于综合加权算法，获得声韵时间控制比例，添加声韵权重值因子，重新计算单音素口型动画的时间，控制口型动画的合成，将合成的汉语语音与人脸口型动画同步；步骤7：根据动画场景添加背景图像，与合成的汉语语音与人脸口型动画同步；步骤8：基于综合加权算法，获得噪声时间控制比例，添加...

【技术特征摘要】
1. 一种基于综合加权算法的口型动画合成方法，其特征在于，依次包括以下步骤：步骤1:输入汉语文本，针对输入的汉语文本进行分析，将汉字拆分为不同的汉语可视化音素，并将这些因素发送到语音合成系统合成为基本的可视化音素流；步骤2 :基于MPEG-4标准建立具有真实感的参数人脸模型，使用可视化音素动画帧参数驱动模型的形变，实现人脸口型动画；步骤3 :从输入汉语文本中获得与输入汉语文本同步的输入背景噪声，对输入背景噪声进行分析，进行输入背景噪声平滑处理，得到初始输入背景噪声；步骤4 :从汉字拆分为不同的汉语可视化音素中分别提取音素拆分后的音素输入背景噪声，对音素输入背景噪声进行分析，进行音素输入背景噪声平滑处理，得到初始音素输入背景噪声；步骤5 :利用得到的初始音素输入背景噪声，对得到的初始输入背景噪声进行校正，得到校正后的输入背景噪声；步骤6:基于综合加权算法，获得声韵时间控制比例，添加声韵权重值因子，重新计算单音素口型动画的时间，控制口型动画的合成，将合成的汉语语音与人脸口型动画同步；步骤7 :根据动画场景添加背景图像，与合成的汉语语音与人脸口型动画同步；步骤8 :基于综合加权算法，获得噪声时间控制比例，添加噪声权重值因子，计算校正后的输入背景噪声的噪声同步时间；步骤9 :根据动画合成的需求，选择控制添加校正后的输入背景噪声，与合成汉语语音、人脸口型动画和背景图像的合成动画进行同步，实现逼真的人脸口型动画。2. 如权利要求1所述的一种基于综合加权算法的口型动画合成方法，其特征在于：所述针对输入的汉语文本进行分析，将汉字拆分为不同的汉语可视化音素是将汉字按照标准汉语拼音中声母和韵母的划分，完成口型拼音声部和口型拼音韵部的定义，将汉字的标准拼音转换成口型声部和口...

【专利技术属性】
技术研发人员：韩慧健，梁秀霞，贾可亮，张锐，刘峥，其他发明人请求不公开姓名，
申请(专利权)人：韩慧健，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人