在电视盒子上实现数字人交互的方法和装置制造方法及图纸

技术编号：38754115 阅读：9 留言：0更新日期：2023-09-10 09:38

本申请提供了一种在电视盒子上实现数字人交互的方法和装置，包括：采集用户的音视频数据，将所述音视频数据上传至云服务器，其中，所述音视频数据包括用户的视频和/或音频；接收所述云服务器发送的数字人音视频流，其中，所述数字人音视频流包括数字人视频流和音频流，组成所述数字人视频流的各个图像帧的背景颜色为指定颜色；对所述各个图像帧进行处理，以使数字人形象从所述指定颜色的背景中分离出来，并将处理后的各个图像帧与所述电视盒子的用户界面进行图像混合，对所述音频流进行播放，通过该方案能够克服电视盒子的硬件限制，将数字人业务应用在电视盒子，实现数字人在电视盒子的界面上与用户交互。视盒子的界面上与用户交互。视盒子的界面上与用户交互。

全部详细技术资料下载

【技术实现步骤摘要】
在电视盒子上实现数字人交互的方法和装置

[0001]本专利技术涉及计算机
，特别涉及一种在电视盒子上实现数字人交互的方法和装置。

技术介绍

[0002]相关技术中，随着科技的进步，电视盒子已经成为了许多家庭中不可或缺的一部分，为用户提供了丰富的娱乐和信息服务。然而，电视盒子的硬件性能通常较低，对于一些复杂的计算任务，如运行数字人业务，就显得力不从心。数字人业务是最近几年AI技术的一种应用，能够根据用户的需求提供问题解答、功能讲解、投诉建议等服务，极大地改善了用户的交互体验。然而，这种业务通常需要大量的计算资源以进行图像渲染和语音识别等任务，因此无法在电视盒子上本地运行。
[0003]有鉴于此，如何克服电视盒子的硬件限制，将数字人业务应用在电视盒子，使其能够利用云服务在本地提供数字人业务，实现数字人在电视盒子的界面上与用户交互，成为亟待解决的技术问题。

技术实现思路

[0004]有鉴于此，本申请实施例提供一种在电视盒子上实现数字人交互的方法和装置、电子设备及存储介质，能够有效地约束关节点角度，实现更为准确和可控的动作捕捉。
[0005]第一方面，本申请实施例提供了一种在电视盒子上实现数字人交互的方法，应用于电视盒子，包括：采集用户的音视频数据，将所述音视频数据上传至云服务器，其中，所述音视频数据包括用户的视频和/或音频；接收所述云服务器发送的数字人音视频流，其中，所述数字人音视频流包括数字人视频流和音频流，组成所述数字人视频流的各个图像帧的背景颜色为指定颜色；对所述各个图像帧进行处...

【技术保护点】

【技术特征摘要】
1.一种在电视盒子上实现数字人交互的方法，应用于电视盒子，其特征在于，包括：采集用户的音视频数据，将所述音视频数据上传至云服务器，其中，所述音视频数据包括用户的视频和/或音频；接收所述云服务器发送的数字人音视频流，其中，所述数字人音视频流包括数字人视频流和音频流，组成所述数字人视频流的各个图像帧的背景颜色为指定颜色；对所述各个图像帧进行处理，以使数字人形象从所述指定颜色的背景中分离出来，并将处理后的各个图像帧与所述电视盒子的用户界面进行图像混合，对所述音频流进行播放。2.根据权利要求1所述的方法，其特征在于，还包括：接收所述云服务器发送的控制指令；其中，在所述对所述音频流进行播放之后，还包括：执行所述控制指令。3.一种在电视盒子上实现数字人交互的方法，应用于云服务器，其特征在于，包括：接收电视盒子上传的用户的音视频数据，其中，所述音视频数据包括用户的视频和/或音频；对所述音视频数据进行解析，得到解析结果，利用所述解析结果生成数字人的回应，以及驱动数字人的表情和/或动作发生变化，并渲染出数字人形象；通过将所述数字人形象放置在指定颜色的背景上得到数字人视频流，将数字人音视频流发送给电视盒子，其中，所述数字人音视频流包括数字人视频流和音频流，所述音频流包括所述数字人的回应。4.根据权利要求3所述的方法，其特征在于，所述对所述音视频数据进行解析，得到解析结果，利用所述解析结果生成数字人的回应，以及驱动数字人的表情/动作发生变化，包括：对所述用户的视频进行面部表情识别，得到用户的面部表情和肢体动作中的至少之一和/或将所述用户的音频转换为文本；利用所述用户的面部表情和/或肢体动作和/或文本生成数字人的回应，以及目标表情和/或目标动作，驱动数字人展现所述目标表情和/或驱动数字人做出所述目标动作。5.根据权利要求4所述的方法，其特征在于，还包括：利用所述用户的面部表情和/或肢体动作和/或文本生成控制指令，并将所述控制指令发送给所述电视盒子。6.一种在电视盒子上实现数字人交互的装置，应用于电视盒子，其特征在于，包括：上传单元，用于采集...

【专利技术属性】
技术研发人员：王笃，
申请(专利权)人：海马云天津信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人