用于生成信息的方法和装置制造方法及图纸

技术编号:22240236 阅读:20 留言:0更新日期:2019-10-09 19:54
本公开实施例公开了用于生成信息的方法和装置,涉及云计算领域。该方法的一具体实施方式包括:接收客户端发送的用户的视频和音频;对上述视频和音频进行分析处理,确定上述用户的意图类别;根据上述用户的意图类别和预设的业务信息集合,生成反馈信息;基于上述反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频;将上述三维虚拟人像的视频发送给上述客户端,以供上述客户端呈现给上述用户。该实施方式现了向客户端反馈满足用户意图类别的三维虚拟人像的视频,提高了用户与三维虚拟人像现场交互的准确性。

Methods and devices for generating information

【技术实现步骤摘要】
用于生成信息的方法和装置
本公开实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
随着人工智能(ArtificialIntelligence,AI)技术的飞速发展,智能服务已经被应用到了各个领域。例如,金融领域的智能客服、智能理财顾问等等。虚拟人像技术通过渲染三维虚拟人像,可以为智能服务提供更为便捷的使用体验,从而提升了用户与三维虚拟人像交互时三维虚拟人像的拟人度。现有的虚拟人像技术虽然已经具有较高的拟人效果,但大多仍然停留在脚本化的应用场景,例如三维游戏、电影CG(ComputerGraphics,计算机动画)等,只能做到按照指示的内容对已经设计好的动作进行响应,且研发人力和时间成本都较高。
技术实现思路
本公开实施例提出了用于生成信息的方法和装置。第一方面,本公开实施例提供了一种用于生成信息的方法,该方法包括:接收客户端发送的用户的视频和音频;对上述视频和音频进行分析处理,确定上述用户的意图类别;根据上述用户的意图类别和预设的业务信息集合,生成反馈信息;基于上述反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频;将上述三维虚拟人像的视频发送给上述客户端,以供上述客户端呈现给上述用户。在一些实施例中,上述反馈信息为文本反馈信息;以及上述基于上述反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频,包括:根据上述文本反馈信息生成语音反馈信息;根据上述文本反馈信息,从预设的人像信息集合获取目标人像信息,其中,上述目标人像信息包括目标表情信息、目标口型信息和目标动作信息;根据上述语音反馈信息、目标表情信息、目标口型信息和目标动作信息,通过动画引擎生成三维虚拟人像的视频。在一些实施例中,上述人像信息集合包括表情信息集合、口型信息集合和动作信息集合;以及上述根据上述文本反馈信息,从预设的人像信息集合获取目标人像信息,包括:根据上述文本反馈信息,从上述表情信息集合中确定目标表情信息;根据上述文本反馈信息,从上述口型信息集合中确定目标口型信息;根据上述文本反馈信息,从上述动作信息集合中确定目标动作信息;将上述目标表情信息、目标口型信息和目标动作信息作为目标人像信息。在一些实施例中,上述根据上述文本反馈信息生成语音反馈信息,包括:将上述文本反馈信息输入预先建立的语音生成模型,生成语音反馈信息,其中,上述语音生成模型是基于真人语音训练得到的。在一些实施例中,上述方法还包括:接收三维虚拟人像的定制请求,其中,上述定制请求包括用于确定三维虚拟人像外观的信息;根据上述定制请求,确定三维虚拟人像的外观。第二方面,本公开实施例提供了一种用于生成信息的装置,装置包括:接收单元,被配置成接收客户端发送的用户的视频和音频;分析单元,被配置成对上述视频和音频进行分析处理,确定上述用户的意图类别;第一生成单元,被配置成根据上述用户的意图类别和预设的业务信息集合,生成反馈信息;第二生成单元,被配置成基于上述反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频;发送单元,被配置成将上述三维虚拟人像的视频发送给上述客户端,以供上述客户端呈现给上述用户。在一些实施例中,上述反馈信息为文本反馈信息;以及上述第二生成单元包括:语音生成单元,被配置成根据上述文本反馈信息生成语音反馈信息;获取单元,被配置成根据上述文本反馈信息,从预设的人像信息集合获取目标人像信息,其中,上述目标人像信息包括目标表情信息、目标口型信息和目标动作信息;视频生成单元,被配置成根据上述语音反馈信息、目标表情信息、目标口型信息和目标动作信息,通过动画引擎生成三维虚拟人像的视频。在一些实施例中,上述人像信息集合包括表情信息集合、口型信息集合和动作信息集合;以及上述获取单元进一步被配置成:根据上述文本反馈信息,从上述表情信息集合中确定目标表情信息;根据上述文本反馈信息,从上述口型信息集合中确定目标口型信息;根据上述文本反馈信息,从上述动作信息集合中确定目标动作信息;将上述目标表情信息、目标口型信息和目标动作信息作为目标人像信息。在一些实施例中,上述语音生成单元进一步被配置成:将上述文本反馈信息输入预先建立的语音生成模型,生成语音反馈信息,其中,上述语音生成模型是基于真人语音训练得到的。在一些实施例中,上述装置还包括:请求接收单元,被配置成接收三维虚拟人像的定制请求,其中,上述定制请求包括用于确定三维虚拟人像外观的信息;确定单元,被配置成根据上述定制请求,确定三维虚拟人像的外观。第三方面,本公开实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本公开实施例提供的用于生成信息的方法和装置,首先,接收客户端发送的用户的视频和音频。其次,对视频和音频进行分析处理,确定用户的意图类别。再次,根据用户的意图类别和预设的业务信息集合生成反馈信息。然后,基于反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频。最后,将生成的三维虚拟人像的视频发送给客户端,以供客户端呈现给用户。从而实现了向客户端反馈满足用户意图类别的三维虚拟人像的视频,提高了用户与三维虚拟人像现场交互的准确性,以及三维虚拟人像的拟人度,提升了用户体验。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:图1是本公开的一个实施例可以应用于其中的示例性系统架构图;图2是根据本公开的用于生成信息的方法的一个实施例的流程图;图3是根据本公开的用于生成信息的方法的一个应用场景的示意图;图4是根据本公开的用于生成信息的方法的又一个实施例的流程图;图5是根据本公开的用于生成信息的装置的一个实施例的结构示意图;图6是适于用来实现本公开实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。图1示出了可以应用本公开实施例的用于生成信息的方法或用于生成信息的装置的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如聊天机器人应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备10本文档来自技高网...

【技术保护点】
1.一种用于生成信息的方法,包括:接收客户端发送的用户的视频和音频;对所述视频和音频进行分析处理,确定所述用户的意图类别;根据所述用户的意图类别和预设的业务信息集合,生成反馈信息;基于所述反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频;将所述三维虚拟人像的视频发送给所述客户端,以供所述客户端呈现给所述用户。

【技术特征摘要】
1.一种用于生成信息的方法,包括:接收客户端发送的用户的视频和音频;对所述视频和音频进行分析处理,确定所述用户的意图类别;根据所述用户的意图类别和预设的业务信息集合,生成反馈信息;基于所述反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频;将所述三维虚拟人像的视频发送给所述客户端,以供所述客户端呈现给所述用户。2.根据权利要求1所述的方法,其中,所述反馈信息为文本反馈信息;以及所述基于所述反馈信息,通过动画引擎生成预先建立的三维虚拟人像的视频,包括:根据所述文本反馈信息生成语音反馈信息;根据所述文本反馈信息,从预设的人像信息集合获取目标人像信息,其中,所述目标人像信息包括目标表情信息、目标口型信息和目标动作信息;根据所述语音反馈信息、目标表情信息、目标口型信息和目标动作信息,通过动画引擎生成三维虚拟人像的视频。3.根据权利要求2所述的方法,其中,所述人像信息集合包括表情信息集合、口型信息集合和动作信息集合;以及所述根据所述文本反馈信息,从预设的人像信息集合获取目标人像信息,包括:根据所述文本反馈信息,从所述表情信息集合中确定目标表情信息;根据所述文本反馈信息,从所述口型信息集合中确定目标口型信息;根据所述文本反馈信息,从所述动作信息集合中确定目标动作信息;将所述目标表情信息、目标口型信息和目标动作信息作为目标人像信息。4.根据权利要求2所述的方法,其中,所述根据所述文本反馈信息生成语音反馈信息,包括:将所述文本反馈信息输入预先建立的语音生成模型,生成语音反馈信息,其中,所述语音生成模型用于表征文本与语音的对应关系,所述语音生成模型是基于真人语音训练得到的。5.根据权利要求1所述的方法,其中,所述方法还包括:接收三维虚拟人像的定制请求,其中,所述定制请求包括用于确定三维虚拟人像外观的信息;根据所述定制请求,确定三维虚拟人像的外观。6.一种用于生成信息的装置,包括:接收单元,被配置成接收客户端发送的用户的视频和音频;分析单元,被配置成对所述视频和音频进行分析处理,确定所述用户的意图类别;第一生成单元,被配置成根据所述用户的意...

【专利技术属性】
技术研发人员:黄靖博范美华何建斌王励皓蔡振盛孔世康赵亚飞王建祥陈超陈波李全港刘羽
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1