音频数据处理方法、系统、装置、设备以及存储介质制造方法及图纸

技术编号:32780416 阅读:22 留言:0更新日期:2022-03-23 19:38
本公开提供了一种音频数据处理方法、系统、装置、设备以及存储介质,涉及涉及人工智能技术领域,尤其涉及语音交互、虚拟数字人等技术领域。具体实现方案为:云手机客户端采集目标音频数据,并将目标音频数据发送至云手机服务端;云手机服务端根据目标音频数据,确定虚拟对象音频数据和虚拟对象视频数据;以及将虚拟对象音频数据和虚拟对象视频数据发送至云手机客户端;然后云手机客户端播放虚拟对象音频数据和虚拟对象视频数据。频数据和虚拟对象视频数据。频数据和虚拟对象视频数据。

【技术实现步骤摘要】
音频数据处理方法、系统、装置、设备以及存储介质


[0001]本公开涉及人工智能
,尤其涉及语音交互、虚拟数字人等


技术介绍

[0002]传统客服系统基于PSTN(Public Switched Telephone Network,公共交换电话网络)。用户需要通过手机、固话等拨打呼叫中心的电话从而接入后端的人工客服或智能客服,并且只能基于语音维度进行交互。近年来,得益于深度学习算法的突破,虚拟数字人技术飞速发展,很多公司将传统的音频客服,升级到了基于虚拟数字人的“数字员工”客服。基于虚拟数字人的“数字员工”客服可以向用户提供音频和视频两个维度的交互方式。

技术实现思路

[0003]本公开提供了一种音频数据处理方法、系统、装置、设备、存储介质以及计算机程序产品。
[0004]根据本公开的一方面,提供了一种音频数据处理方法,包括:采集目标音频数据,并将所述目标音频数据发送至所述云手机服务端;以及接收来自所述云手机服务端的虚拟对象音频数据和虚拟对象视频数据,并播放所述虚拟对象音频数据和虚拟对象视频数据。
[0005]根据本公开的另一方面,提供了一种音频数据处理方法,包括:接收来自云手机客户端的目标音频数据;根据所述目标音频数据,确定虚拟对象音频数据和虚拟对象视频数据;以及将所述虚拟对象音频数据和所述虚拟对象视频数据发送至所述云手机客户端。
[0006]根据本公开的另一方面,提供了一种音频数据处理装置,包括:接收模块,用于接收来自所述云手机客户端的目标音频数据;处理模块,用于根据所述目标音频数据,确定虚拟对象音频数据和虚拟对象视频数据;以及发送模块,用于将所述虚拟对象音频数据和所述虚拟对象视频数据发送至所述云手机客户端。
[0007]根据本公开的另一方面,提供了一种音频数据处理装置,包括:音频采集模块,用于采集目标音频数据;通信模块,用于将所述目标音频数据发送至云手机服务端,以及接收来自所述云手机服务端的虚拟对象音频数据和虚拟对象视频数据;音频播放模块,用于播放所述虚拟对象音频数据;以及显示模块,用于播放所述虚拟对象视频数据。
[0008]本公开的另一个方面提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例所示的方法。
[0009]根据本公开实施例的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开实施例所示的方法。
[0010]根据本公开实施例的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现本公开实施例所示方法的步骤。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特
征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1是根据本公开实施例的音频数据处理方法、装置、电子设备和存储介质的系统架构示意图;
[0014]图2示意性示出了根据本公开的实施例的音频数据处理方法的流程图;
[0015]图3示意性示出了根据本公开另一实施例的音频数据处理方法的流程图;
[0016]图4示意性示出了根据本公开另一实施例的确定虚拟人音频数据和虚拟人视频数据的方法的流程图;
[0017]图5示意性示出了根据本公开实施例的音频数据处理装置的框图;
[0018]图6示意性示出了根据本公开另一实施例的音频数据处理装置的框图;以及
[0019]图7示意性示出了可以用来实施本公开的实施例的示例电子设备的框图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]以下将结合图1对本公开提供的系统架构方法、装置、电子设备和存储介质的的系统架构进行描述。
[0022]图1是根据本公开实施例的音频数据处理方法、装置、电子设备和存储介质的系统架构示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0023]如图1所示,该系统架构100包括云手机客户端110和云手机服务端120。
[0024]云手机客户端110可以包括音频采集模块、通信模块、音频播放模块和显示模块。其中,音频采集模块可以用于采集音频数据,例如可以包括麦克风等。通信模块可以用于与其他电子设备进行网络通信,例如可以包括网卡、调制解调器、无线通信收发机等。音频播放模块可以用于播放音频数据,例如可以包括扬声器等。显示模块可以用于播放视频数据,例如可以包括显示器等。
[0025]根据本公开的实施例,云手机客户端110例如可以包括智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0026]云手机服务端120可以是为云手机客户端110提供云手机服务的服务器。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(Virtual Private Server,或简称VPS)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0027]云手机服务端120可以部署一个或多个虚拟手机实例。每个虚拟手机实例与一个
云手机客户端对应,例如,云手机服务端120中可以部署与云手机客户端110对应的虚拟手机实例。每个虚拟手机实例中可以配置有各种应用程序,例如通信应用121和虚拟对象应用122。其中,通信应用121可以用于处理与云手机客户端之间的数据传输,例如接收来自云手机客户端的目标音频数据和向云手机客户端发送虚拟对象的音视频数据。虚拟对象应用122可以用于对音频数据进行处理并生成相应的虚拟对象。该虚拟手机实例中可以包括与云手机客户端110的麦克风、扬声器和显示器对应的麦克风模块、扬声器模块和显示器模块。可以分别使用与麦克风模块、扬声器模块和显示器模块对应的应用程序接口(Application Programming Interface,API)121来调用麦克风模块、扬声器模块和显示器模块。
[0028]云手机客户端110和云手机服务端120之间可以建立通信连接130,云手机客户端110和云手机服务端120之间可以通过该通信连接130传输数据,以进行交本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据处理方法,包括:接收来自云手机客户端的目标音频数据;根据所述目标音频数据,确定虚拟对象音频数据和虚拟对象视频数据;以及将所述虚拟对象音频数据和所述虚拟对象视频数据发送至所述云手机客户端。2.根据权利要求1所述的方法,还包括利用通信应用执行以下操作:接收来自所述云手机客户端的目标音频数据;以及将所述目标音频数据输入所述云手机服务端的麦克风输入接口。3.根据权利要求2所述的方法,其中,所述接收来自所述云手机客户端的目标音频数据包括:通过与所述云手机客户端之间的实时音视频通信连接,接收来自所述云手机客户端的目标音频数据。4.根据权利要求3所述的方法,还包括利用虚拟对象应用执行以下操作:通过所述云手机服务端的麦克风输出接口获取所述目标音频数据;根据所述目标音频数据,确定虚拟对象音频数据和虚拟对象视频数据;以及将所述虚拟对象音频数据输入所述云手机服务端的扬声器输入接口,并将所述虚拟对象视频数据输入所述云手机服务端的显示器输入接口。5.根据权利要求4所述的方法,还包括利用所述通信应用执行以下操作:通过所述云手机服务端的扬声器输出接口获取与所述目标音频数据对应的所述虚拟对象音频数据,并通过所述云手机服务端的显示器输出接口获取与所述目标音频数据对应的虚拟对象视频数据;以及将所述虚拟对象音频数据和所述虚拟对象视频数据发送至所述云手机客户端。6.根据权利要求5所述的方法,其中,所述将所述虚拟对象音频数据和所述虚拟对象视频数据发送至所述云手机客户端包括:通过与所述云手机客户端之间的实时音视频通信连接,将所述虚拟对象音频数据和所述虚拟对象视频数据发送至所述云手机客户端。7.一种音频数据处理方法,包括:采集目标音频数据,并将所述目标音频数据发送至所述云手机服务端;以及接收来自所述云手机服务端的虚拟对象音频数据和虚拟对象视频数据,并播放所述虚拟对象音频数据和虚拟对象视频数据。8.根据权利要求7所述的方法,所述将所述目标音频数据发送至所述云手机服务端包括:通过与所述云手机服务端之间的实时音视频通信连接,将所述目标音频数据发送至所述云手机服务端。9.根据权利要求7所述的方法,所述接收来自所述云手机服务端的虚拟对象音频数据和虚拟对象视频数据包括:通过与所述云手机服务端之间的实时音视频通信连接,接收来自所述云手机服务端的虚拟对象音频数据和虚拟对象视频数据。10.一种音频数据处理装置,包括:接收模块,用于接收来自所述云手机客户端的目标音频数据;
处理模块,用于根据所述目标音频数据,确定虚拟对象音频数据和虚拟对象视频数据;以及发送模块,用于将所述虚拟对象音频数据和所述虚拟对象视频数据发送至所述云手机客户端。...

【专利技术属性】
技术研发人员:郭启行贾磊张洪彬
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1