内容交互的方法、装置、设备和介质制造方法及图纸

技术编号：32738026 阅读：11 留言：0更新日期：2022-03-20 08:44

一种内容交互的方法、装置、计算机设备、存储介质和计算机程序产品，涉及人工智能领域，尤其涉及增强/虚拟现实技术和人机交互技术领域。该方法包括：将获取到的用户输入内容发送给服务器；确定与用户输入内容相关联的至少一个基底表情标识符；将至少一个基底表情标识符发送至服务器；接收来自服务器的与用户输入内容相关联的语音文件以及与至少一个基底表情标识符对应的至少一组控制系数；基于至少一个基底表情标识符、语音文件和至少一组控制系数，利用渲染引擎生成虚拟人物。利用渲染引擎生成虚拟人物。利用渲染引擎生成虚拟人物。

全部详细技术资料下载

【技术实现步骤摘要】
内容交互的方法、装置、设备和介质

[0001]本公开涉及计算机
，尤其涉及人工智能(AI)，具体涉及一种内容交互的方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术、增强现实技术等几大方向。
[0003]近年来，随着人工智能技术的快速发展，人机交互技术已经被广泛应用在人们的生活中。人机交互的方式大多基于按键、触摸、语音进行输入，通过在显示屏上呈现图像、文本或虚拟人物进行回应。但是目前的带有虚拟形象的人物都是基于移动端或者云端的渲染方案，应用在网页端的智能客服对话系统只有对话功能，缺少了虚拟形象来和用户进行交互，导致服务模型相对程序化，不够灵活，用户的体验不佳。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种内容交互的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006...

【技术保护点】

【技术特征摘要】
1.一种内容交互的方法，包括：将获取到的用户输入内容发送给服务器；确定与所述用户输入内容相关联的至少一个基底表情标识符，所述至少一个基底表情标识符标识虚拟人物的至少一种基底表情；将所述至少一个基底表情标识符发送至所述服务器；接收来自所述服务器的与所述用户输入内容相关联的语音文件以及与所述至少一个基底表情标识符对应的至少一组控制系数，所述语音文件由所述服务器通过进行文本到语音转换而生成，所述至少一组控制系数由所述服务器通过对所述语音文件进行语音到动作转换而生成，以用于在所述至少一种基底表情的基础上控制所述虚拟人物的面部动作；以及基于所述至少一个基底表情标识符、所述语音文件和所述至少一组控制系数，利用渲染引擎生成所述虚拟人物。2.如权利要求1所述的方法，所述用户输入内容为文本输入内容，所述确定与所述用户输入内容相关联的至少一个基底表情标识符包括：接收来自所述服务器的应答文本,所述应答文本由所述服务器通过确定针对所述文本输入内容的应答内容而生成；以及确定对应于所述应答文本的至少一个基底表情标识符，所述与所述用户输入内容相关联的语音文件为对应于所述应答文本的语音文件。3.如权利要求1所述的方法，所述用户输入内容为语音输入内容，所述确定与所述用户输入内容相关联的至少一个基底表情标识符包括：接收来自所述服务器的应答文本,所述应答文本由所述服务器通过将所述语音输入内容转换为文本输入内容，并通过确定针对所述文本输入内容的应答内容而生成；以及确定对应于所述应答文本的至少一个基底表情标识符，所述与所述用户输入内容相关联的语音文件为对应于所述应答文本的语音文件。4.如权利要求1所述的方法，所述确定与所述用户输入内容相关联的至少一个基底表情标识符包括：分析所述用户输入内容，确定对应于所述用户输入内容的至少一个基底表情标识符。5.如权利要求1至4中任一项所述的方法，所述利用所述渲染引擎生成所述虚拟人物包括：基于所述至少一个基底表情标识符和所述至少一组控制系数，利用所述渲染引擎渲染所述虚拟人物；以及输出对应于所述语音文件的语音。6.如权利要求1至4中任一项所述的方法，所述渲染引擎包括动画驱动模块、面部动作驱动模块和模型渲染库，所述模型渲染库中存储有预先渲染的不同于所述面部动作的虚拟人物形象配置，并且所述利用所述渲染引擎渲染所述虚拟人物包括：基于所述至少一个基底表情标识符，利用所述动画驱动模块渲染所述虚拟人物的基底表情；基于所述至少一组控制系数，利用所述面部动作驱动模块渲染所述虚拟人物的面部动作；以及
基于所述虚拟人物的基底表情、所述虚拟人物的面部动作和所述模型渲染库中存储的虚拟人物形象配置，生成所述虚拟人物。7.如权利要求1至4中任一项所述的方法，所述渲染引擎为three.js网页级渲染引擎。8.一种使得客户端能够进行内容交互的方法，包括：接收由所述客户端获取的用户输入内容；接收由所述客户端确定的与所述用户输入内容相关联的至少一个基底表情标识符，所述至少一个基底表情标识符标识虚拟人物的至少一种基底表情；生成与所述用户输入内容相关联的语音文件以及与所述至少一个基底表情标识符对应的至少一组控制系数，所述语音文件通过进行文本到语音转换而生成，所述至少一组控制系数通过对所述语音文件进行语音到动作转换而生成，以用于在所述至少一种基底表情的基础上控制所述虚拟人物的面部动作；以及向所述客户端发送所述语音文件和所述至少一组控制系数，以使得所述客户端能够基于所述至少一个基底表情标识符、所述语音文件和所述至少一组控制系数，利...

【专利技术属性】
技术研发人员：付钰，李鑫，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人