一种虚拟形象对话交互方法及相关设备和系统技术方案

技术编号:38462417 阅读:12 留言:0更新日期:2023-08-11 14:39
本发明专利技术提供了一种虚拟形象对话交互方法及相关设备和系统,其中,虚拟形象对话交互方法包括:接收终端发送的用户交互信息,用户交互信息包括用户的交互输入信息;根据用户交互信息,从预先构建的预渲染资源集中获取对交互输入信息进行响应所需的预渲染资源,预渲染资源集包括3D虚拟形象的若干条不同的预渲染资源,3D虚拟形象的每条预渲染资源包括虚拟形象资源和相关联的话术资源;将获取的预渲染资源发送至终端,以使终端在接收到预渲染资源时,将接收的预渲染资源渲染成3D虚拟形象的交互响应视频并展示。本发明专利技术提供的虚拟形象对话交互方法对终端的性能没有较高的要求,这使得本发明专利技术提供的虚拟形象对话交互方法能够大规模在C端落地。在C端落地。在C端落地。

【技术实现步骤摘要】
一种虚拟形象对话交互方法及相关设备和系统


[0001]本专利技术涉及人机交互
,尤其涉及一种虚拟形象对话交互方法及相关设备和系统。

技术介绍

[0002]随着计算机技术的不断发展和人机交互方式的不断演进,虚拟形象对话交互(即通过3D虚拟形象与用户对话交互)成为了当下的热点交互方式之一。相比于2D虚拟形象,3D虚拟形象可以365度的进行呈现,可在虚拟空间中以任意角度进行拍摄,视觉呈现效果丰富完整。
[0003]3D虚拟形象当前面临的问题是对硬件性能依赖较大。目前,3D虚拟形象对话交互的实现方案大多为,在一台高性能GPU主机上运行3D虚拟形象,在通过3D虚拟形象与用户交互时,GPU主机根据用户交互信息实时生成3D虚拟形象的渲染数据,进而将3D虚拟形象的渲染数据渲染成画面进行呈现。
[0004]然而,由于一台高性能GPU主机成本较高,且服务时需要固定服务场所,因此,其只能在营业厅,线下门店等场景中使用,可见,现有的虚拟形象对话交互的实现方案无法大规模在C端场景(C端场景指的是,基于单一个人的服务业务场景)落地。

技术实现思路

[0005]有鉴于此,本专利技术提供了一种虚拟形象对话交互方法及相关设备和系统,用以解决现有的虚拟形象对话交互的实现方案无法大规模在C端场景落地的问题,其技术方案如下:
[0006]一种虚拟形象对话交互方法,应用于服务器,所述方法包括:
[0007]接收终端发送的用户交互信息,其中,所述用户交互信息包括用户的交互输入信息;
[0008]根据所述用户交互信息,从预先构建的预渲染资源集中,获取对所述交互输入信息进行响应所需的预渲染资源,其中,所述预渲染资源集包括3D虚拟形象的若干条不同的预渲染资源,所述3D虚拟形象的每条预渲染资源包括虚拟形象资源和相关联的话术资源;
[0009]将获取的预渲染资源发送至终端,以使所述终端在接收到预渲染资源时,将接收的预渲染资源渲染成所述3D虚拟形象的交互响应视频并展示。
[0010]可选的,构建预渲染资源集的过程包括:
[0011]制作至少能够说话的3D虚拟形象;
[0012]针对构建的话术资源集中的每条话术资源,基于虚拟摄像头获取所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的预渲染资源;
[0013]由获得的预渲染资源组成预渲染资源集。
[0014]可选的,所述制作至少能够说话的3D虚拟形象,包括:
[0015]制作能够说话、能够做动作、能够适配表情的3D虚拟形象;
[0016]所述基于虚拟摄像头获取所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的预渲染资源,包括:
[0017]基于虚拟摄像头获取不同拍摄参数下所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的多条预渲染资源,其中,所述3D虚拟形象在播报该话术资源时做出与该话术资源适配的动作和表情。
[0018]可选的,所述预渲染资源集还包括场景预渲染资源;
[0019]构建预渲染资源集的过程还包括:
[0020]针对若干3D虚拟场景中的每个3D虚拟场景,基于所述虚拟摄像头获取不同拍摄参数下该3D虚拟场景的预渲染资源;
[0021]由各3D虚拟场景的预渲染资源组成场景预渲染资源。
[0022]可选的,所述基于虚拟摄像头获取不同拍摄参数下所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的多条预渲染资源,包括:
[0023]获取多组拍摄参数,其中,所述多组拍摄参数均包括景别参数,所述多组拍摄参数中的景别参数均为远景;
[0024]控制虚拟摄像头按获取的每组拍摄参数获取所述3D虚拟形象播报该话术资源的预渲染资源,以得到所述3D虚拟形象在该话术资源下的多条远景预渲染资源;
[0025]将所述3D虚拟形象在该话术资源下的多条远景预渲染资源分别处理成中景预渲染资源和近景预渲染资源,以得到所述3D虚拟形象在该话术资源下的多条中景预渲染资源和多条近景预渲染资源;
[0026]所述基于所述虚拟摄像头获取不同拍摄参数下该3D虚拟场景的预渲染资源,包括:
[0027]控制所述虚拟摄像头按每组拍摄参数获取该3D虚拟场景的预渲染资源,以得到该3D虚拟场景的远景预渲染资源;
[0028]将该3D虚拟场景的远景预渲染资源分别处理成中景预渲染资源和近景预渲染资源,以得到该3D虚拟场景的中景预渲染资源和近景预渲染资源。
[0029]可选的,所述拍摄参数包括拍摄角度,所述拍摄角度包括主拍摄角度和副拍摄角度;
[0030]所述基于虚拟摄像头获取不同拍摄参数下所述3D虚拟形象播报该话术资源的预渲染资源,包括:
[0031]针对每组拍摄参数:
[0032]若该组拍摄参数中的拍摄角度为主拍摄角度,则基于虚拟摄像头获取该组拍摄参数下所述3D虚拟形象完整播报完该话术资源的预渲染资源;
[0033]若该组拍摄参数中的拍摄角度为副拍摄角度,则基于虚拟摄像头获取该组拍摄参数下所述3D虚拟形象播报该话术资源的部分话术资源的预渲染资源。
[0034]可选的,所述根据所述用户交互信息,从预先构建的预渲染资源集中,获取对所述交互输入信息进行响应所需的预渲染资源,包括:
[0035]根据所述用户交互信息中的交互输入信息,从所述预渲染资源集中确定对所述交互输入信息进行响应所需的话术资源,作为目标话术资源;
[0036]根据所述用户交互信息和所述目标话术资源,从所述预渲染资源集中获取对所述
交互输入信息进行响应所需的虚拟形象资源,作为目标虚拟形象资源。
[0037]可选的,所述预渲染资源集中与每条话术资源关联的虚拟形象资源有多条,与每条话术资源关联的多条虚拟形象资源为不同拍摄参数下的虚拟形象资源,每条虚拟形象资源包括若干虚拟形象帧信息;
[0038]所述根据所述用户交互信息和所述目标话术资源,从所述预渲染资源集中获取对所述交互输入信息进行响应所需的虚拟形象资源,包括:
[0039]根据所述用户交互信息,确定对所述交互输入信息进行响应所需的预渲染资源的配置信息,其中,所述配置信息包括对所述交互输入信息进行响应所需的预渲染资源包含的每一帧的配置参数,所述配置参数至少包括拍摄参数;
[0040]从与所述目标话术资源关联的虚拟形象资源中,获取与每一帧的配置参数匹配的虚拟形象帧信息,得到对所述交互输入信息进行响应所需的虚拟形象资源。
[0041]可选的,所述预渲染资源集还包括场景预渲染资源;所述场景预渲染资源包括若干场景帧信息;所述配置参数还包括场景参数;
[0042]所述根据所述用户交互信息,从预先构建的预渲染资源集中,获取对所述交互输入信息进行响应所需的预渲染资源,还包括:
[0043]从所述预渲染资源集中的场景预渲染资源中获取与每一帧的配置参数中的拍摄参数和场景参本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚拟形象对话交互方法,其特征在于,应用于服务器,所述方法包括:接收终端发送的用户交互信息,其中,所述用户交互信息包括用户的交互输入信息;根据所述用户交互信息,从预先构建的预渲染资源集中,获取对所述交互输入信息进行响应所需的预渲染资源,其中,所述预渲染资源集包括3D虚拟形象的若干条不同的预渲染资源,所述3D虚拟形象的每条预渲染资源包括虚拟形象资源和相关联的话术资源;将获取的预渲染资源发送至终端,以使所述终端在接收到预渲染资源时,将接收的预渲染资源渲染成所述3D虚拟形象的交互响应视频并展示。2.根据权利要求1所述的虚拟形象对话交互方法,其特征在于,构建预渲染资源集的过程包括:制作至少能够说话的3D虚拟形象;针对构建的话术资源集中的每条话术资源,基于虚拟摄像头获取所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的预渲染资源;由获得的预渲染资源组成预渲染资源集。3.根据权利要求2所述的虚拟形象对话交互方法,其特征在于,所述制作至少能够说话的3D虚拟形象,包括:制作能够说话、能够做动作、能够适配表情的3D虚拟形象;所述基于虚拟摄像头获取所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的预渲染资源,包括:基于虚拟摄像头获取不同拍摄参数下所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的多条预渲染资源,其中,所述3D虚拟形象在播报该话术资源时做出与该话术资源适配的动作和表情。4.根据权利要求3所述的虚拟形象对话交互方法,其特征在于,所述预渲染资源集还包括场景预渲染资源;构建预渲染资源集的过程还包括:针对若干3D虚拟场景中的每个3D虚拟场景,基于所述虚拟摄像头获取不同拍摄参数下该3D虚拟场景的预渲染资源;由各3D虚拟场景的预渲染资源组成场景预渲染资源。5.根据权利要求4所述的虚拟形象对话交互方法,其特征在于,所述基于虚拟摄像头获取不同拍摄参数下所述3D虚拟形象播报该话术资源的预渲染资源,得到所述3D虚拟形象在该话术资源下的多条预渲染资源,包括:获取多组拍摄参数,其中,所述多组拍摄参数均包括景别参数,所述多组拍摄参数中的景别参数均为远景;控制虚拟摄像头按获取的每组拍摄参数获取所述3D虚拟形象播报该话术资源的预渲染资源,以得到所述3D虚拟形象在该话术资源下的多条远景预渲染资源;将所述3D虚拟形象在该话术资源下的多条远景预渲染资源分别处理成中景预渲染资源和近景预渲染资源,以得到所述3D虚拟形象在该话术资源下的多条中景预渲染资源和多条近景预渲染资源;所述基于所述虚拟摄像头获取不同拍摄参数下该3D虚拟场景的预渲染资源,包括:控制所述虚拟摄像头按每组拍摄参数获取该3D虚拟场景的预渲染资源,以得到该3D虚
拟场景的远景预渲染资源;将该3D虚拟场景的远景预渲染资源分别处理成中景预渲染资源和近景预渲染资源,以得到该3D虚拟场景的中景预渲染资源和近景预渲染资源。6.根据权利要求3所述的虚拟形象对话交互方法,其特征在于,所述拍摄参数包括拍摄角度,所述拍摄角度包括主拍摄角度和副拍摄角度;所述基于虚拟摄像头获取不同拍摄参数下所述3D虚拟形象播报该话术资源的预渲染资源,包括:针对每组拍摄参数:若该组拍摄参数中的拍摄角度为主拍摄角度,则基于虚拟摄像头获取该组拍摄参数下所述3D虚拟形象完整播报完该话术资源的预渲染资源;若该组拍摄参数中的拍摄角度为副拍摄角度,则基于虚拟摄像头获取该组拍摄参数下所述3D虚拟形象播报该话术资源的部分话术资源的预渲染资源。7.根据权利要求1所述的虚拟形象对话交互方法,其特征在于,所述根据所述用户交互信息,从预先构建的预渲染资源集中,获取对所述交互输入信息进行响应所需的预渲染资源,包括:根据所述用户交互信息中的交互输入信息,从所述预渲染资源集中确定对所述交互输入信息进行响应所需的话术资源,作为目标话术资源;根据所述用户交互信息和所述目标话术资源,从所述预渲染资源集中获取对所述交互输入信息进行响应所需的虚拟形象资源,作为目标虚拟形象资源。8.根据权利要求7所述的虚拟形象对话交互方法,其特征在于,所述预渲染资源集中与每条话术资源关联的虚...

【专利技术属性】
技术研发人员:张子隆张颜文朱家泉
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1