一种获得唇形动画的方法及装置制造方法及图纸

技术编号：14416380 阅读：106 留言：0更新日期：2017-01-12 04:57

本申请公开一种获得唇形动画的方法及装置。该方法包括：获取音频数据；提取所述音频数据的频域特征值；根据所述频域特征值与预设的匹配度阈值，选取至少一个唇形动画模型；以及根据所述至少一个唇形动画模型，生成唇形动画。该方法能够逼真模拟VR中虚拟人物说话时的唇形。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机应用
，具体涉及一种获得唇形动画的方法及装置。
技术介绍
VR(VirtualReality，即虚拟现实，简称VR)，是由美国VPL公司创建人拉尼尔(JaronLanier)在20世纪80年代初提出的。其具体内涵是：综合利用计算机图形系统和各种现实及控制等接口设备，在计算机上生成的、可交互的三维环境中提供沉浸感觉的技术。其中，计算机生成的、可交互的三维环境称为虚拟环境(即VirtualEnvironment，简称VE)。虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统的技术。它利用计算机生成一种模拟环境，利用多源信息融合的交互式三维动态视景和实体行为的系统仿真使用户沉浸到该环境中。在VR场景中需要获得更真实的交互式体验，需要拥有和现实世界相同的交互方式，所以，现实世界中最常见的对话交互的方式在VR场景中将会得到大量运用。在进行VR游戏时，如果仅能清晰的听到对方在讲话，但是显示中的虚拟角色的口型和当前所听见的语音对不上号，在很大程度上破坏了用户的沉浸感。在现有的VR社交游戏中，唇形模拟只是在角色说话时对预先设置的几个唇形进行简单地变化，不能对人的唇形进行更逼真的模拟。即使用户说话的音量有变化，在唇形显示上也看不到差别。在所述
技术介绍
部分公开的上述信息仅用于加强对本专利技术的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此，本专利技术提供一种获得唇形动画的方法及装置，能够逼真模拟VR中虚拟人物说话时的唇形。本专利技术的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本专利...

【技术保护点】
一种获得唇形动画的方法，其特征在于，包括：获取音频数据；提取所述音频数据的频域特征值；根据所述频域特征值与预设的匹配度阈值，选取至少一个唇形动画模型；以及根据所述至少一个唇形动画模型，生成唇形动画。

【技术特征摘要】
1.一种获得唇形动画的方法，其特征在于，包括：获取音频数据；提取所述音频数据的频域特征值；根据所述频域特征值与预设的匹配度阈值，选取至少一个唇形动画模型；以及根据所述至少一个唇形动画模型，生成唇形动画。2.如权利要求1所述的方法，其特征在于，在提取所述音频数据的频域特征值之前还包括：对所述音频数据进行静音切除处理。3.如权利要求1或2所述的方法，其特征在于，所述音频数据为时域信号，提取所述音频数据的频域特征值包括：使用窗函数将所述音频数据分为多帧音频数据；通过傅里叶变换，分别将每帧音频数据转化为频域音频数据；以及通过MFCC算法，分别提取每帧所述频域音频数据的频域特征值。4.如权利要求3所述的方法，其特征在于，通过MFCC算法，分别提取每帧所述频域音频数据的频域特征值包括：通过Mel滤波器组，分别对每帧所述频域音频数据进行滤波，得到第一中间结果：对所述第一中间结果进行对数运算，得到第二中间结果；以及对所述第二中间结果进行离散余弦变换，得到每帧所述频域音频数据的频域特征值。5.如权利要求3所述的方法，其特征在于，根据所述频域特征值与预设的匹配度阈值，选取至少一个唇形动画模型包括：通过调整余弦相似度，分别计算所述频域特征值与预存的唇形动画模型的特征向量的匹配度；以及选取所述匹配度大于所述匹配度阈值的所述至少一个唇形动画模型。6.如权利要求5所述的方法，其特征在于，根据所述至少一个唇形动画模型，生成唇形动画包括：对所述至少一个唇形动画模型进行加权叠加，以生成所述唇形动画；其中每个唇形动画模型的加权值为所述唇形动画与所述频域特征值的匹配度。7.如权利要求1或2所述的方法，其特征在于，所述唇形动画模型包括：唇部特征点对应的位置信息。8.一种获得唇形动画的装置，其特征在于，包括：数据获取模块，用于获取音频数据；...

【专利技术属性】
技术研发人员：吴志武，韩志轩，
申请(专利权)人：网易杭州网络有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人