可装载多套预生成话术及实时话术的数字人引擎装置及方法制造方法及图纸

技术编号:39846204 阅读:7 留言:0更新日期:2023-12-29 16:43
本发明专利技术涉及一种可装载多套预生成话术及实时话术的数字人引擎装置及方法,其装置包括预生成话术装载器和实时话术生成器,其中,预生成话术装载器:这个部分主要负责装载多套预生成的话术,每套话术针对可能的特定语境或者场景进行设定,装载的话术可在接收到相关指令时被立即调用,以满足不同的环境和应用需求;实时话术生成器:这个模块能根据实时的对话环境,快速生成符合语境的实时话术,利用先进的自然语言处理技术,通过理解和分析用户的需求,生成贴近语境

【技术实现步骤摘要】
可装载多套预生成话术及实时话术的数字人引擎装置及方法
[
][0001]本专利技术涉及人工智能
,具体地说是一种可装载多套预生成话术及实时话术的数字人引擎装置及方法

[
技术介绍
][0002]在当前的人工智能领域,数字人引擎已经在多个方面得到了广泛的使用,如智能餐厅的服务生

虚拟助手等

这些数字人引擎通常都由内置的数字模型驱动,可以通过语音或文本的方式与用户沟通交流

这些引擎主要依赖于固定的话术模板进行对话,这种模式对每个具体的语境和应答添加了预编程的规则

然而,这样的数字人引擎主要存在以下几个问题:
[0003]首先,预编程的对话模式使得数字人引擎的互动性受限,其对话内容和回应行为往往非常机械,固定话术的运用无法应对复杂

变化多端的即时对话情境

其次,现有的引擎大部分仅能够装载有限的话术,无法满足同时装载多套话术的需求,这限制了它们在不同场景或者不同应用中的通用性和灵活性

[0004]再者,现有的数字人引擎基本上仅依赖于预设的话术进行工作,缺少实时话术生成的能力,这对于处理实时对话

及时回应用户需求则相当不足

需要注意的是,预设的话术无法适应所有的对话环境,尤其是在某些复杂的对话环境下,预设的话术可能无法提供任何有效的回应

[0005]总体来看,现有的数字人引擎在互动性

灵活性和实时性方面存在明显的不足,急需一种新型的数字人引擎来解决上述问题

[
技术实现思路
][0006]本专利技术的目的就是要解决上述的不足而提供一种可装载多套预生成话术及实时话术的数字人引擎装置,具有更好的互动性

灵活性和实时性,实现了同时装载多套预生成话术并能实时生成话术的功能,可以为广泛的应用场景提供更为出色的服务

[0007]本专利技术一方面,提供了一种可装载多套预生成话术及实时话术的数字人引擎装置,包括预生成话术装载器和实时话术生成器,其中,
[0008]所述预生成话术装载器用于装载多套预生成的话术,每套话术针对可能的特定语境或者场景进行设定,且装载的话术可在接收到相关指令时被立即调用;
[0009]所述实时话术生成器用于根据实时的对话环境,快速生成符合语境的实时话术

[0010]作为一种实施例,所述预生成话术装载器中,用户可设定多套场景以及角色属性,场景和角色属性收集完成后,通过语言模型进行预测并生成该场景的所有可能问题与对应的回答话术;用户的每一个问题会作为输入传递给预生成话术装载器,用于匹配最符合的问题与回答话术

[0011]作为一种实施例,所述实时话术生成器中,当预生成话术装载器内的问题与回答无法满足用户的实际提问时,实时话术生成器启动;实时话术生成器利用自然语言处理技
术,通过理解和分析用户的需求,生成实时回答话术

[0012]作为一种实施例,还包括智能切换控制器,所述智能切换控制器根据用户的对话环境和需求,智能调度预生成话术装载器和实时话术生成器;当用户开始对话时,智能切换控制器首先判断用户所处的场景和语境,然后调用相应领域的预生成话术集;对于复杂或特定需求的对话,智能切换控制器切换到实时话术生成器,生成贴近语境

满足需求的话术

[0013]作为一种实施例,本专利技术装置具体包括数字人
API
服务模块

场景话术预判模块

预生成话术服务模块

实时话术服务模块

智能语音交互模块以及模拟人类口型服务模块,数字人
API
服务模块的输入端连接用户端,数字人
API
服务模块的输出端连接场景话术预判模块,场景话术预判模块内设置有大语言模型和向量数据库,并预判有无预生成话术,若有预生成话术则发送至预生成话术服务模块,若无预生成话术则发送至实时话术服务模块,预生成话术服务模块

实时话术服务模块分别将文字合成音频传输至智能语音交互模块,由智能语音交互模块对口型合成视频并传送至模拟人类口型服务模块,最后由模拟人类口型服务模块返回视频
URL
地址至数字人
API
服务模块

[0014]本专利技术另一方面,提供了一种可装载多套预生成话术及实时话术的数字人引擎方法,包括以下步骤:
[0015]预生成话术装载,装载多套预生成的话术,每套话术针对可能的特定语境或者场景进行设定,且装载的话术可在接收到相关指令时被立即调用,以满足不同的环境和应用需求;
[0016]实时话术生成,根据实时的对话环境,快速生成符合语境的实时话术

[0017]作为一种实施例,本专利技术方法包括以下步骤:
[0018]在预生成话术装载器首先根据所需要解决的实际问题和互动应用,生成多套预先话术,每套预生成话术都包含了相应领域的常见问题和回答;
[0019]实时话术生成器运用先进的深度学习模型和自然语言处理技术,对输入的用户需求进行分析理解,并在此基础上生成符合需求的实时话术;
[0020]智能切换控制器根据用户的对话环境和需求,智能调度预生成话术装载器和实时话术生成器;当用户开始对话时,首先判断用户所处的场景和语境,然后调用相应领域的预生成话术集;对于复杂或特定需求的对话,则切换到实时话术生成器,生成贴近语境

满足需求的话术

[0021]作为一种实施例,用户设定多套场景以及角色属性,场景和角色属性收集完成后,通过语言模型进行预测并生成该场景的所有可能问题与对应的回答话术;用户的每一个问题会作为输入传递给预生成话术装载器,用于匹配最符合的问题与回答话术;当预生成话术装载器内的问题与回答无法满足用户的实际提问时,实时话术生成器启动,实时话术生成器利用自然语言处理技术,通过理解和分析用户的需求,生成实时回答话术

[0022]本专利技术第三方面,提出了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,所述程序执行上述方法

[0023]本专利技术第四方面,提出了一种计算机设备,包括:处理器

存储器和总线;所述处理器与所述存储器通过所述总线连接;所述存储器用于存储程序,所述处理器用于运行程序,所述程序运行时执行上述方法

[0024]本专利技术同现有技术相比,具有如下优点:
[0025](1)
提高互动性:本专利技术通过结合实时话术生成器,可以根据实时对话环境生成贴合语境的回复,大大提高了数字人与用户的互动性

[0026](2)
提高灵活性:多套预生成话术的设计,使得装置能够应对更多种类的语境和应用,提升了装置的应用范围和灵活性
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种可装载多套预生成话术及实时话术的数字人引擎装置,其特征在于:包括预生成话术装载器和实时话术生成器,其中,所述预生成话术装载器用于装载多套预生成的话术,每套话术针对可能的特定语境或者场景进行设定,且装载的话术可在接收到相关指令时被立即调用;所述实时话术生成器用于根据实时的对话环境,快速生成符合语境的实时话术
。2.
如权利要求1所述的装置,其特征在于:所述预生成话术装载器中,用户可设定多套场景以及角色属性,场景和角色属性收集完成后,通过语言模型进行预测并生成该场景的所有可能问题与对应的回答话术;用户的每一个问题会作为输入传递给预生成话术装载器,用于匹配最符合的问题与回答话术
。3.
如权利要求1所述的装置,其特征在于:所述实时话术生成器中,当预生成话术装载器内的问题与回答无法满足用户的实际提问时,实时话术生成器启动;实时话术生成器利用自然语言处理技术,通过理解和分析用户的需求,生成实时回答话术
。4.
如权利要求1所述的装置,其特征在于:还包括智能切换控制器,所述智能切换控制器根据用户的对话环境和需求,智能调度预生成话术装载器和实时话术生成器;当用户开始对话时,智能切换控制器首先判断用户所处的场景和语境,然后调用相应领域的预生成话术集;对于复杂或特定需求的对话,智能切换控制器切换到实时话术生成器,生成贴近语境

满足需求的话术
。5.
如权利要求1所述的装置,其特征在于:包括数字人
API
服务模块

场景话术预判模块

预生成话术服务模块

实时话术服务模块

智能语音交互模块以及模拟人类口型服务模块,数字人
API
服务模块的输入端连接用户端,数字人
API
服务模块的输出端连接场景话术预判模块,场景话术预判模块内设置有大语言模型和向量数据库,并预判有无预生成话术,若有预生成话术则发送至预生成话术服务模块,若无预生成话术则发送至实时话术服务模块,预生成话术服务模块

实时话术服务模块分别将文字合成音频传输至智能语音交互模块,由智能语音交互模块...

【专利技术属性】
技术研发人员:彭维玮
申请(专利权)人:上海数珩信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1