【技术实现步骤摘要】
一种3D数字人的音画同步方法及电子设备
[0001]本申请涉及虚拟现实
,尤其涉及一种3D数字人的音画同步方法及电子设备。
技术介绍
[0002]目前,随着5G(5th Generation Mobile Communication Technology,第五代移动通信技术)和XR(extended
‑
range,扩展范围)技术的结合,三维重建技术正在飞速的发展。三维重建是指根据单视图或者多视图的图像重建三维信息的过程。三维重建技术分为离线和实时,离线三维重建技术是通过体积视频向用户展示提前录制好的三维重建后的3D数字人。而实时三维重建技术则是需要将实时采集的人体模型数据和驱动数据,通过网络传输到对端进行实时渲染并显示。基于三维重建的虚拟社交为应用场景,通过三维通讯系统,可以实现不同用户通过三维重建将各自的动态三维模型和驱动数据传输给其他用户,通过VR(Virtual Reality,虚拟现实)设备或者AR(Augmented Reality,增强现实)设备来达到身临其境的面对面交互的沉浸体验,有别于传统电话或者视频会议的通讯方式。
[0003]对用户进行三维重建后的三维数据分为模型数据和3D驱动数据。其中,模型数据是人体在静止状态下,通过深度摄像机360度拍摄人体后的点云以及纹理数据,3D驱动数据则是人体实时动作变化的数据,利用3D驱动数据来驱动人体模型数据。在3D驱动数据驱动人体模型数据的同时,会有语音交互。
[0004]但是,目前在Webrtc(Web Real
...
【技术保护点】
【技术特征摘要】
1.一种3D数字人的音画同步方法,其特征在于,所述方法包括:针对任意一个对象,利用预先设置好的实时传输协议RTP时间戳与网络时间协议NTP时间戳的对应关系,确定与所述对象的音频数据中当前待播放的音频信号的RTP时间戳相对应的NTP时间戳;将所述对象的3D驱动数据中的当前帧3D驱动数据的目标NTP时间戳与所述当前待播放的音频信号的NTP时间戳进行比对,确定所述对象的3D驱动数据是否与所述对象的音频数据同步,其中,所述当前帧3D驱动数据的目标NTP时间戳是基于所述当前帧3D驱动数据的NTP时间戳得到的所述3D驱动数据是用于驱动所述对象的3D数字人进行运动的;若确定所述对象的3D驱动数据与所述对象的音频数据不同步,则对所述对象的3D驱动数据进行帧调整,以使所述对象的3D驱动数据与所述音频数据同步。2.根据权利要求1所述的方法,其特征在于,所述将所述对象的3D驱动数据中的当前帧3D驱动数据的目标NTP时间戳与所述当前待播放的音频信号的NTP时间戳进行比对,确定所述对象的3D驱动数据是否与所述对象的音频数据同步,包括:若所述当前待播放的音频信号的NTP时间戳与所述当前帧3D驱动数据的目标NTP时间戳的绝对差值大于指定阈值,则确定所述对象的3D驱动数据与所述对象的音频数据不同步;若所述当前待播放的音频信号的NTP时间戳与所述当前帧3D驱动数据的目标NTP时间戳的差值不大于指定阈值,则确定所述对象的3D驱动数据与所述对象的音频数据同步。3.根据权利要求1所述的方法,其特征在于,所述对所述对象的3D驱动数据进行帧调整,包括:若所述当前待播放的音频信号的NTP时间戳超前所述当前帧3D驱动数据的目标NTP时间戳,则丢掉所述对象的3D驱动数据中的当前帧3D驱动数据,并将所述当前帧3D驱动数据的下一帧3D驱动数据确定为当前帧3D驱动数据后,重新比对所述对象的3D驱动数据中的当前帧3D驱动数据的目标NTP时间戳与所述当前待播放的音频信号的NTP时间戳,直至所述对象的3D驱动数据与所述对象的音频数据同步;或,若所述当前帧3D驱动数据的目标NTP时间戳超前所述待播放的音频信号的NTP时间戳,则降低所述对象的3D驱动数据的帧率,直至所述对象的3D驱动数据与所述对象的音频数据同步。4.根据权利要求3所述的方法,其特征在于,所述降低所述对象的3D驱动数据的帧率,包括:按照设定帧间隔从所述对象的3D驱动数据中获取目标3D驱动数据,其中,所述目标3D驱动数据为驱动3D数字人进行渲染的3D驱动数据。5.根据权利要求3所述的方法,其特征在于,所述对象的3D驱动数据存储在数据缓冲区;所述丢掉所述对象的3D驱动数据中的当前帧3D驱动数据之前,所述方法还包括:确定所述数据缓冲区中的3D驱动数据的帧数大于指定帧数。6.根据权利要求1~3中任一所述的方法,其特征在于,通过以下方式确定所述当前帧3D驱动数据的目标NTP时间戳:将所述当前帧3D...
【专利技术属性】
技术研发人员:位言东,
申请(专利权)人:聚好看科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。