内容交互的方法、装置、设备和介质制造方法及图纸

技术编号:32738026 阅读:11 留言:0更新日期:2022-03-20 08:44
一种内容交互的方法、装置、计算机设备、存储介质和计算机程序产品,涉及人工智能领域,尤其涉及增强/虚拟现实技术和人机交互技术领域。该方法包括:将获取到的用户输入内容发送给服务器;确定与用户输入内容相关联的至少一个基底表情标识符;将至少一个基底表情标识符发送至服务器;接收来自服务器的与用户输入内容相关联的语音文件以及与至少一个基底表情标识符对应的至少一组控制系数;基于至少一个基底表情标识符、语音文件和至少一组控制系数,利用渲染引擎生成虚拟人物。利用渲染引擎生成虚拟人物。利用渲染引擎生成虚拟人物。

【技术实现步骤摘要】
内容交互的方法、装置、设备和介质


[0001]本公开涉及计算机
,尤其涉及人工智能(AI),具体涉及一种内容交互的方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术、增强现实技术等几大方向。
[0003]近年来,随着人工智能技术的快速发展,人机交互技术已经被广泛应用在人们的生活中。人机交互的方式大多基于按键、触摸、语音进行输入,通过在显示屏上呈现图像、文本或虚拟人物进行回应。但是目前的带有虚拟形象的人物都是基于移动端或者云端的渲染方案,应用在网页端的智能客服对话系统只有对话功能,缺少了虚拟形象来和用户进行交互,导致服务模型相对程序化,不够灵活,用户的体验不佳。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种内容交互的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一种内容交互的方法,该方法包括:将获取到的用户输入内容发送给服务器;确定与用户输入内容相关联的至少一个基底表情标识符,至少一个基底表情标识符标识虚拟人物的至少一种基底表情;将至少一个基底表情标识符发送至服务器;接收来自服务器的与用户输入内容相关联的语音文件以及与至少一个基底表情标识符对应的至少一组控制系数,语音文件由服务器通过进行文本到语音转换而生成,至少一组控制系数由服务器通过对语音文件进行语音到动作转换而生成,以用于在至少一种基底表情的基础上控制虚拟人物的面部动作;以及基于至少一个基底表情标识符、语音文件和至少一组控制系数,利用渲染引擎生成虚拟人物。
[0007]根据本公开的另一方面,提供了一种使得客户端能够进行内容交互的方法,包括:接收由客户端获取的用户输入内容;接收由客户端确定的与用户输入内容相关联的至少一个基底表情标识符,至少一个基底表情标识符标识虚拟人物的至少一种基底表情;生成与用户输入内容相关联的语音文件以及与至少一个基底表情标识符对应的至少一组控制系数,语音文件通过进行文本到语音转换而生成,至少一组控制系数通过对语音文件进行语音到动作转换而生成,以用于在至少一种基底表情的基础上控制虚拟人物的面部动作;以
及向客户端发送语音文件和至少一组控制系数,以使得客户端能够基于至少一个基底表情标识符、语音文件和至少一组控制系数,利用渲染引擎来生成虚拟人物。
[0008]根据本公开的另一方面,提供了一种内容交互的装置,该装置包括:第一单元,被配置用于将获取到的用户输入内容发送给服务器;第二单元,被配置用于确定与用户输入内容相关联的至少一个基底表情标识符,至少一个基底表情标识符标识虚拟人物的至少一种基底表情;第三单元,被配置用于将至少一个基底表情标识符发送至服务器;第四单元,被配置用于将应答文本以及对应于应答文本至少一个的动画组件名称发送至服务器;第五单元,被配置用于接收来自服务器的与用户输入内容相关联的语音文件以及与至少一个基底表情标识符对应的至少一组控制系数,语音文件由服务器通过进行文本到语音转换而生成,至少一组控制系数由服务器通过对语音文件进行语音到动作转换而生成,以用于在至少一种基底表情的基础上控制虚拟人物的面部动作;以及第六单元,被配置用于基于至少一个基底表情标识符、语音文件和至少一组控制系数,利用渲染引擎生成虚拟人物。
[0009]根据本公开的另一方面,提供了一种使得客户端能够进行内容交互的装置,该装置包括:第七单元,被配置用于接收由客户端获取的用户输入内容;第八单元,接收由客户端确定的与用户输入内容相关联的至少一个基底表情标识符,至少一个基底表情标识符标识虚拟人物的至少一种基底表情;第九单元,被配置用于生成与用户输入内容相关联的语音文件以及与至少一个基底表情标识符对应的至少一组控制系数,语音文件通过进行文本到语音转换而生成,至少一组控制系数通过对语音文件进行语音到动作转换而生成,以用于在至少一种基底表情的基础上控制虚拟人物的面部动作;以及第十单元,被配置用于向客户端发送语音文件和至少一组控制系数,以使得客户端能够基于至少一个基底表情标识符、语音文件和至少一组控制系数,利用渲染引擎来生成虚拟人物。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,这些指令被至少一个处理器执行,以使至少一个处理器能够执行上述一种内容交互的方法或一种使得客户端能够进行内容交互的方法。
[0011]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行上述内容交互的方法或一种使得客户端能够进行内容交互的方法。
[0012]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述内容交互的方法或一种使得客户端能够进行内容交互的方法。
[0013]本公开的实施例方法和装置适用于各种操作系统、各种浏览器,而且不需要下载安装,轻量易用,提升了用户的体验。
[0014]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0015]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要
求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0016]图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;
[0017]图2示出了根据本公开的实施例的一种内容交互方法的流程图;
[0018]图3示出了根据本公开的实施例的在图2的方法中利用渲染引擎渲染虚拟人物过程的流程图;
[0019]图4示出了根据本公开的实施例的一种使得客户端能够进行内容交互的方法的流程图;
[0020]图5示出了根据本公开的实施例的一种使得客户端能够进行内容交互的方法的流程图;
[0021]图6示出了根据本公开的实施例的一种使得客户端能够进行内容交互的方法的流程图;
[0022]图7示出了根据本公开的实施例的客户端与服务器之间的交互过程的流程图;
[0023]图8示出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容交互的方法,包括:将获取到的用户输入内容发送给服务器;确定与所述用户输入内容相关联的至少一个基底表情标识符,所述至少一个基底表情标识符标识虚拟人物的至少一种基底表情;将所述至少一个基底表情标识符发送至所述服务器;接收来自所述服务器的与所述用户输入内容相关联的语音文件以及与所述至少一个基底表情标识符对应的至少一组控制系数,所述语音文件由所述服务器通过进行文本到语音转换而生成,所述至少一组控制系数由所述服务器通过对所述语音文件进行语音到动作转换而生成,以用于在所述至少一种基底表情的基础上控制所述虚拟人物的面部动作;以及基于所述至少一个基底表情标识符、所述语音文件和所述至少一组控制系数,利用渲染引擎生成所述虚拟人物。2.如权利要求1所述的方法,所述用户输入内容为文本输入内容,所述确定与所述用户输入内容相关联的至少一个基底表情标识符包括:接收来自所述服务器的应答文本,所述应答文本由所述服务器通过确定针对所述文本输入内容的应答内容而生成;以及确定对应于所述应答文本的至少一个基底表情标识符,所述与所述用户输入内容相关联的语音文件为对应于所述应答文本的语音文件。3.如权利要求1所述的方法,所述用户输入内容为语音输入内容,所述确定与所述用户输入内容相关联的至少一个基底表情标识符包括:接收来自所述服务器的应答文本,所述应答文本由所述服务器通过将所述语音输入内容转换为文本输入内容,并通过确定针对所述文本输入内容的应答内容而生成;以及确定对应于所述应答文本的至少一个基底表情标识符,所述与所述用户输入内容相关联的语音文件为对应于所述应答文本的语音文件。4.如权利要求1所述的方法,所述确定与所述用户输入内容相关联的至少一个基底表情标识符包括:分析所述用户输入内容,确定对应于所述用户输入内容的至少一个基底表情标识符。5.如权利要求1至4中任一项所述的方法,所述利用所述渲染引擎生成所述虚拟人物包括:基于所述至少一个基底表情标识符和所述至少一组控制系数,利用所述渲染引擎渲染所述虚拟人物;以及输出对应于所述语音文件的语音。6.如权利要求1至4中任一项所述的方法,所述渲染引擎包括动画驱动模块、面部动作驱动模块和模型渲染库,所述模型渲染库中存储有预先渲染的不同于所述面部动作的虚拟人物形象配置,并且所述利用所述渲染引擎渲染所述虚拟人物包括:基于所述至少一个基底表情标识符,利用所述动画驱动模块渲染所述虚拟人物的基底表情;基于所述至少一组控制系数,利用所述面部动作驱动模块渲染所述虚拟人物的面部动作;以及
基于所述虚拟人物的基底表情、所述虚拟人物的面部动作和所述模型渲染库中存储的虚拟人物形象配置,生成所述虚拟人物。7.如权利要求1至4中任一项所述的方法,所述渲染引擎为three.js网页级渲染引擎。8.一种使得客户端能够进行内容交互的方法,包括:接收由所述客户端获取的用户输入内容;接收由所述客户端确定的与所述用户输入内容相关联的至少一个基底表情标识符,所述至少一个基底表情标识符标识虚拟人物的至少一种基底表情;生成与所述用户输入内容相关联的语音文件以及与所述至少一个基底表情标识符对应的至少一组控制系数,所述语音文件通过进行文本到语音转换而生成,所述至少一组控制系数通过对所述语音文件进行语音到动作转换而生成,以用于在所述至少一种基底表情的基础上控制所述虚拟人物的面部动作;以及向所述客户端发送所述语音文件和所述至少一组控制系数,以使得所述客户端能够基于所述至少一个基底表情标识符、所述语音文件和所述至少一组控制系数,利...

【专利技术属性】
技术研发人员:付钰李鑫
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1