一种基于视频客服系统及构建方法技术方案

技术编号:28948622 阅读:10 留言:0更新日期:2021-06-18 22:06
本发明专利技术属于视频客服技术领域,特别涉及一种基于视频客服系统及构建方法。本发明专利技术提供一种新的基于视频客服系统及构建方法,通过在客户端与客服端之间建立多次的富媒体通话,且专家端可以加入该富媒体通话,无需为专家与客户单独建立会话,此时,富媒体通过相当于群,同时,专家可以随时切换,可以不同的专家分别为同一客户端服务也可以多个不同的专家同时出现在群中对同一客户端服务;该设计不仅可以进一步提升视频客服的工作效率,还可以提升视频客服的服务范围。

【技术实现步骤摘要】
一种基于视频客服系统及构建方法
本专利技术属于视频客服
,特别涉及一种基于视频客服系统及构建方法。
技术介绍
视频客服又叫语音视频客服,是普通网页在线客服的一个升级版。在原来网页单一的文字交流方式上,增添了语音、视频功能,极大程度上丰富了交流方式。现有的视频客服可以实时双向富媒体互动,支持实时音视频,同时可进行文字、图片、文件传输等富媒体沟通。画面实时低延迟,画质清晰,根据带宽双向自动调整清晰度和帧率,但是一个客服只能与一个客户建立会话,工作效率比较低。
技术实现思路
针对上述问题,本专利技术提供一种新的基于视频客服系统及构建方法。本专利技术具体技术方案如下:本专利技术提供一种视频客服构建方法,包括:S1:语音识别步骤,用于通过语音识别模块对接听到的咨询语音进行识别;S2:自然语言处理步骤,用于通过自然语言处理模块对识别后的语音进行自然语言处理;S3:语音合成步骤,用于通过语音合成模块对回复的语音进行语音合成;S4:会话建立步骤,用于通过会话建立模块为商家的客服端与商家所述的客户端建立会话,客户通过会话向对应的客服端提出问题,对客户提出的问题经过步骤S1-S3处理后发送至相应的客户端或者直接将客服端的答复语音发送至客户端;步骤S4包括如下步骤:S41:富媒体通话建立步骤,用于通过富媒体通话单元在客服端与客户端之间建立多次富媒体通话;视频客服构建方法还包括如下步骤:S5:专家接入步骤,用于通过专家接入模块将商家的专家端接入相应的富媒体通话,且在富媒体通话中将专家端的语音流和视频流同步;S6:切换步骤,用于通过切换模块在当接收到客户端发送语音后,对客户语音经步骤S1和S2处理后,识别到客户语音中出现特定语音时,切换专家,将另一专家端接入到富媒体通话,已接入富媒体通话的专家端保持富媒体通话或者自富媒体通话中踢出,并向对应的专家端发送保持或者踢出指令。本专利技术的有益效果如下:本专利技术提供一种新的基于视频客服系统及构建方法,通过在客户端与客服端之间建立多次的富媒体通话,且专家端可以加入该富媒体通话,无需为专家与客户单独建立会话,此时,富媒体通过相当于群,同时,专家可以随时切换,可以不同的专家分别为同一客户端服务也可以多个不同的专家同时出现在群中对同一客户端服务;该设计不仅可以进一步提升视频客服的工作效率,还可以提升视频客服的服务范围。附图说明图1为一些实施例中视频客服系统的结构框图;图2为一些实施例中视频客服构建方法的流程图;图3为另一实施例中视频客服系统的结构框图;图4为另一实施例中视频客服系统的的流程图;图5为再一实施例中视频客服系统的的结构框图;图6为再一实施例中视频客服系统的的流程图。具体实施方式下面结合附图和以下实施例对本专利技术作进一步详细说明。在一些实施例中,可以构建多个专家、多个客服和多个客户:当某一客服与客户建立一个会话(比如通过PC端的网页或移动端的APP)后,基于接入码(接入码指的是基于身份认证、cookie认证等技术生成,但不限于此,方便服务器管理会话的信息其他方式也在本专利技术的构思之内),客服与客户之间可以建立多次富媒体通话(通话指的是视频通话),该富媒体通话为专家、客服或客户可单独维护,但无需为专家与客户单独建立新的会话(会话指的是http会话)。此时原会话相当于群。专家通常为多个,因此可以随时切换到其他专家端;具体构建步骤例如下面所述:如图1、图2所示,本专利技术提供一种视频客服系统,包括:S1:语音识别步骤,用于通过语音识别模块对接听到的咨询语音进行识别;语音识别采用常规的算法实现,本专利技术不做具体限定,比如:基于动态时间规整的算法、基于参数模型的隐马尔可夫模型的方法、基于非参数模型的矢量量化的方法等,均在选择范围内。S2:自然语言处理步骤,用于通过自然语言处理模块对识别后的语音进行自然语言处理;自然语言处理采用常规的算法实现,本专利技术不做具体限定,比如:基于传统机器学习的自然语言处理技术、基于深度学习的自然语言处理技术等,比如,基于传统机器学习的自然语言处理技术中的SVM(支持向量机模型)、Markov(马尔科夫模型)、CRF(条件随机场模型)等方法,基于深度学习的自然语言处理技术中的卷积神经网络、循环神经网络等,均在选择范围内。S3:语音合成步骤,用于通过语音合成模块对回复的语音进行语音合成;语音合成采用常规的算法实现,本专利技术不做具体限定,比如:TACOTRON--端到端的深度学习TTS模型,直接用深度学习的方法训练出一个TTS模型,模型训练完成后,给定input,模型就能生成对应的音频、LPC合成技术、PSOLA合成技术、基于LMA声道模型的语音合成方法等,均在选择范围内;且上述的语音合识别、自然语言处理和语音合成可以基于第三方或是集成在本专利技术的服务器中,均在构思之内。S4:会话建立步骤,用于通过会话建立模块为商家的客服端与商家所述的客户端建立会话,客户通过会话向对应的客服端提出问题,对客户提出的问题经过步骤S1-S3处理后发送至相应的客户端或者直接将客服端的答复语音发送至客户端;步骤S4包括如下步骤:S41:富媒体通话建立步骤,用于通过富媒体通话单元在客服端与客户端之间建立多次富媒体通话;富媒体通话单元的作用与接入码的作用相同,均是为了验证接入者的身份,避免有视频通话乱入的情况;例如,在进行QQ视频通话或者微信视频时,A向B发送视频请求,只有在B通过后才能建立视频通话,B通过的过程即为身份验证的过程。视频客服构建方法还包括如下步骤:S5:专家接入步骤,用于通过专家接入模块将商家的专家端接入相应的富媒体通话,且在富媒体通话中将专家端的语音流和视频流同步;语音流和视频流的同步,采用常用的同步方式,本专利技术不做具体限定,例如下面的同步方案:首先选择一个参考时钟(要求参考时钟上的时间是线性递增的);编码时依据参考时钟上的给每个音视频数据块都打上时间戳;播放时,根据音视频时间戳及参考时钟,来调整播放。所以,视频和音频的同步实际上是一个动态的过程,同步是暂时的,不同步则是常态。以参考时钟为标准,放快了就减慢播放速度;播放快了就加快播放的速度。参考时钟的选择一般来说有以下三种:将视频同步到音频上:就是以音频的播放速度为基准来同步视频。将音频同步到视频上:就是以视频的播放速度为基准来同步音频。将视频和音频同步外部的时钟上:选择一个外部时钟为基准,视频和音频的播放速度都以该时钟为标准。S6:切换步骤,用于通过切换模块在当接收到客户端发送语音后,对客户语音经步骤S1和S2处理后,识别到客户语音中出现特定语音时,切换专家,将另一专家端接入到富媒体通话,已接入富媒体通话的专家端保持富媒体通话或者自富媒体通话中踢出,并向对应的专家端发送保持或者踢出指令。本专利技术提供一种新的基于视本文档来自技高网...

【技术保护点】
1.一种视频客服构建方法,包括:/nS1:语音识别步骤,用于通过语音识别模块对接听到的咨询语音进行识别;/nS2:自然语言处理步骤,用于通过自然语言处理模块对识别后的语音进行自然语言处理;/nS3:语音合成步骤,用于通过语音合成模块对回复的语音进行语音合成;/nS4:会话建立步骤,用于通过会话建立模块为商家的客服端与商家所述的客户端建立会话,客户通过会话向对应的客服端提出问题,对客户提出的问题经过步骤S1-S3处理后发送至相应的客户端或者直接将客服端的答复语音发送至客户端;/n其特征在于,步骤S4包括如下步骤:/nS41:富媒体通话建立步骤,用于通过富媒体通话单元在客服端与客户端之间建立多次富媒体通话;/n视频客服构建方法还包括如下步骤:/nS5:专家接入步骤,用于通过专家接入模块将商家的专家端接入相应的富媒体通话,且在富媒体通话中将专家端的语音流和视频流同步;/nS6:切换步骤,用于通过切换模块在当接收到客户端发送语音后,对客户语音经步骤S1和S2处理后,识别到客户语音中出现特定语音时,切换专家,将另一专家端接入到富媒体通话,已接入富媒体通话的专家端保持富媒体通话或者自富媒体通话中踢出,并向对应的专家端发送保持或者踢出指令。/n...

【技术特征摘要】
1.一种视频客服构建方法,包括:
S1:语音识别步骤,用于通过语音识别模块对接听到的咨询语音进行识别;
S2:自然语言处理步骤,用于通过自然语言处理模块对识别后的语音进行自然语言处理;
S3:语音合成步骤,用于通过语音合成模块对回复的语音进行语音合成;
S4:会话建立步骤,用于通过会话建立模块为商家的客服端与商家所述的客户端建立会话,客户通过会话向对应的客服端提出问题,对客户提出的问题经过步骤S1-S3处理后发送至相应的客户端或者直接将客服端的答复语音发送至客户端;
其特征在于,步骤S4包括如下步骤:
S41:富媒体通话建立步骤,用于通过富媒体通话单元在客服端与客户端之间建立多次富媒体通话;
视频客服构建方法还包括如下步骤:
S5:专家接入步骤,用于通过专家接入模块将商家的专家端接入相应的富媒体通话,且在富媒体通话中将专家端的语音流和视频流同步;
S6:切换步骤,用于通过切换模块在当接收到客户端发送语音后,对客户语音经步骤S1和S2处理后,识别到客户语音中出现特定语音时,切换专家,将另一专家端接入到富媒体通话,已接入富媒体通话的专家端保持富媒体通话或者自富媒体通话中踢出,并向对应的专家端发送保持或者踢出指令。


2.根据权利要求1所述的视频客服构建方法,其特征在于,步骤S5中,在专家端接入到富媒体通话后,将客服端自富媒体通话中踢出,并向客服端发送踢出指令;
优选的,客服端通过接收模块接收到踢出指令后,通过会话模块向会话建立模块发送与另一客户端建立另一富媒体通话的请求。


3.根据权利要求1所述的视频客服构建方法,其特征在于,所述视频客服构建方法还包括如下步骤:
S7:专家分身步骤,用于通过专家分身模块将接入富媒体通话中的专家端设置为虚拟专家,且将所述虚拟专家的图像和语音形成同一媒体流,其中,所述虚拟专家包括在富媒体通话中专家的图像是真实的,语音是合成的,或者图像是合成的,语音是真实的,或者图像和语音均是合成的。


4.根据权利要求3所述的视频客服构建方法,其特征在于:步骤S3中包括如下步骤:
S31:专家库建立步骤,用于通过专家库建立单元采集专家的声音建立专家库,并对专家库进行训练建立语音模型;
S32:图像库建立步骤,用于通过图像库建立单元采集专家的图像,并建立图像库;
S33:专家语音合成步骤,用于通过专家语音合成单元基于语音模型和专家库进行专家语音合成;
S34:...

【专利技术属性】
技术研发人员:娄鑫
申请(专利权)人:中通天鸿北京通信科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1