基于虚拟数字人实现智能化实时交互问答的系统及其处理方法技术方案

技术编号:37789874 阅读:19 留言:0更新日期:2023-06-09 09:20
本发明专利技术涉及一种基于虚拟数字人实现智能化实时交互问答的系统,其中,该系统包括:语音识别模块,用于接收用户输入的语音音频,将相应的音频进行转写处理;前端H5,用于抓取用户的语音音频并将其传输给语音识别模块,并将传输转写/输入后的文本发送给数字人业务中控;数字人服务模块,用于在进行人像渲染的同时进行语音合成处理;智能服务后台,用于利用系统的知识图谱能力解析客户问题,并针对不同的问题以卡片模板的形式展现给客户。本发明专利技术还涉及一种相应的方法。采用了本发明专利技术的该基于虚拟数字人实现智能化实时交互问答的系统及其方法,为行业树立数字化财富管理服务提供范本,对提升行业智能投顾服务的整体金融科技水平具有良好的示范作用。良好的示范作用。良好的示范作用。

【技术实现步骤摘要】
基于虚拟数字人实现智能化实时交互问答的系统及其处理方法


[0001]本专利技术涉及智能AI
,尤其涉及虚拟数字人
,具体是指一种基于虚拟数字人实现智能化实时交互问答的系统及其处理方法。

技术介绍

[0002]在人工智能和虚拟现实等技术高速发展的推动下,虚拟数字人在制作和性能等方面得到了巨大的优化,其发展逐渐从简单的外观数字化向深入到行为交互的智能化转变。
[0003]目前,用于访谈业务的虚拟数字人的访谈话术需要人工提前进行配置,在与用户的交互过程中,虚拟数字人按照预设的访谈话术与用户进行交流,降低了用户与虚拟数字人交互的灵活性,大大影响了用户的交互体验。
[0004]当前的AI虚拟数字人技术、文本解析技术、语音识别技术目前均是人工智能领域较为成熟的技术,关于其典型的应用有软件类智能客服、硬件类智能音箱等等,而结合了数字人技术的应用,目前以元宇宙概念为主,能够做到与数字主播、投资理财问答、金融业务办理等场景相融合,并且实现用户多场景、沉浸式、口语化的投顾咨询实时交互解答的应用是现有技术所缺乏的。r/>
技术实现思路
<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于虚拟数字人实现智能化实时交互问答的系统,其特征在于,所述的系统包括:语音识别模块,用于接收用户输入的语音音频,将相应的音频进行转写处理,并返回转写的文本;前端H5,与所述的语音识别模块相连接,用于抓取用户的语音音频并将其传输给所述的语音识别模块,并将传输转写/输入后的文本发送给数字人业务中控,同时接收后台解析的结果,并向用户展示数字人的交互能力;数字人服务模块,与所述的前端H5相连接,用于在进行人像渲染的同时进行语音合成处理,并对数字人进行综合服务管理,以完成相应的业务功能;以及智能服务后台,与所述的数字人服务模块相连接,用于利用系统的知识图谱能力解析客户问题,获取客户的真实意图,并针对不同的问题以卡片模板的形式展现给客户,同时支持数字人的实时播报。2.根据权利要求1所述的基于虚拟数字人实现智能化实时交互问答的系统,其特征在于,所述的语音识别模块具体包括:基础语音识别单元,用于检测用户输入的音频流,并通过基础语音识别模型将语音转写成文字;端点检测单元,用于对输入的音频流进行分析,确定用户说话的起始和终止的处理过程;后处理功能单元,用于将识别引擎输出的文本结果以更加符合人类说话习惯的方式展现给调用者。3.根据权利要求2所述的基于虚拟数字人实现智能化实时交互问答的系统,其特征在于,所述的后处理功能单元,具体包括以下功能:顺滑处理:将识别结果文本中将不合理的语气词进行替换;标点处理:根据识别结果给文本内容加上标点符号;数字规整处理:将识别结果中的中文数字更换成合理的阿拉伯数字;替换列表处理:将识别结果中的某些指定文字替换成列表中映射的文字。4.根据权利要求2所述的基于虚拟数字人实现智能化实时交互问答的系统,其特征在于,所述的数字人服务模块主要包括语音合成处理TTS、人像渲染以及业务服务功能,其中,所述的语音合成处理TTS设置在CPU2中,用于在进行人像渲染时依赖TTS语音合成技术的输入,生产视频;以及设置在GPU中的人像渲染集群,所述的人像渲染集群中包括渲染网关、唇动算法以及渲染引擎,其用于负责渲染资源的管理和分配,通过输入渲染指令,使用指定的渲染引擎,并对相应的指令进行解析,并以此实施渲染。5.根据权利要求4所述的基于虚拟数字人实现智能化实时交互问答的系统,其特征在于,所述的业务服务功能设置在CPU1中,其包括业务中控、客服接管平台、业务平台、流媒体服务器以及视频合成服务,且所述的业务服务功能用于:提供业务中控前端接口,用于数字人与用户之间的交互;提供业务中控后端接口,用户数字人与智能服务对话机器人之间的交互;提供后台管理服务,用于管理数字人的人像配置、用户配置、会话配置,并利用相应的
画布平台进行流程管理和配置,同时针对不同的业务场景配置不同的业务流程。6.根据权利要求5所述的基于虚拟数字人实现智能化实时交互问答的系统,其特征在于,所述的数字人服务模块中还设置有:数字人业务中控,其用于完成数字人的业务控制,包括账号校验、RTC信息生成、渲染服务调用,以及提供对外对内的接口;且所述的数字人业务中控还包括进行以下处理:(a)创建连接(a1)接收数字人创建请求,建立长连接;(a2)账号检验;(a3)生成RTC房间信息;(a4)向渲染网关发起渲染请求;(a5)返回RTC信息至调用端;(b)渲染过程(b1)调用端...

【专利技术属性】
技术研发人员:俞枫周素珍江慧慧唐登龙王琦
申请(专利权)人:国泰君安证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1