可装载多套预生成话术及实时话术的数字人引擎装置及方法制造方法及图纸

技术编号：39846204 阅读：7 留言：0更新日期：2023-12-29 16:43

本发明专利技术涉及一种可装载多套预生成话术及实时话术的数字人引擎装置及方法，其装置包括预生成话术装载器和实时话术生成器，其中，预生成话术装载器：这个部分主要负责装载多套预生成的话术，每套话术针对可能的特定语境或者场景进行设定，装载的话术可在接收到相关指令时被立即调用，以满足不同的环境和应用需求；实时话术生成器：这个模块能根据实时的对话环境，快速生成符合语境的实时话术，利用先进的自然语言处理技术，通过理解和分析用户的需求，生成贴近语境

全部详细技术资料下载

【技术实现步骤摘要】
可装载多套预生成话术及实时话术的数字人引擎装置及方法
[
][0001]本专利技术涉及人工智能
，具体地说是一种可装载多套预生成话术及实时话术的数字人引擎装置及方法
。
[
技术介绍
][0002]在当前的人工智能领域，数字人引擎已经在多个方面得到了广泛的使用，如智能餐厅的服务生
、
虚拟助手等
。
这些数字人引擎通常都由内置的数字模型驱动，可以通过语音或文本的方式与用户沟通交流
。
这些引擎主要依赖于固定的话术模板进行对话，这种模式对每个具体的语境和应答添加了预编程的规则
。
然而，这样的数字人引擎主要存在以下几个问题：
[0003]首先，预编程的对话模式使得数字人引擎的互动性受限，其对话内容和回应行为往往非常机械，固定话术的运用无法应对复杂
、
变化多端的即时对话情境
。
其次，现有的引擎大部分仅能够装载有限的话术，无法满足同时装载多套话术的需求，这限制了它们在不同场景或者不同应用中的通用性和灵活性
。
[0004]再者，现有的数字人引擎基本上仅依赖于预设的话术进行工作，缺少实时话术生成的能力，这对于处理实时对话
、
及时回应用户需求则相当不足
。
需要注意的是，预设的话术无法适应所有的对话环境，尤其是在某些复杂的对话环境下，预设的话术可能无法提供任何有效的回应
。
[0005]总体来看，现有的数字人引擎在互动性
、
灵活性和实时性方面存在明...

【技术保护点】

【技术特征摘要】
1.
一种可装载多套预生成话术及实时话术的数字人引擎装置，其特征在于：包括预生成话术装载器和实时话术生成器，其中，所述预生成话术装载器用于装载多套预生成的话术，每套话术针对可能的特定语境或者场景进行设定，且装载的话术可在接收到相关指令时被立即调用；所述实时话术生成器用于根据实时的对话环境，快速生成符合语境的实时话术
。2.
如权利要求1所述的装置，其特征在于：所述预生成话术装载器中，用户可设定多套场景以及角色属性，场景和角色属性收集完成后，通过语言模型进行预测并生成该场景的所有可能问题与对应的回答话术；用户的每一个问题会作为输入传递给预生成话术装载器，用于匹配最符合的问题与回答话术
。3.
如权利要求1所述的装置，其特征在于：所述实时话术生成器中，当预生成话术装载器内的问题与回答无法满足用户的实际提问时，实时话术生成器启动；实时话术生成器利用自然语言处理技术，通过理解和分析用户的需求，生成实时回答话术
。4.
如权利要求1所述的装置，其特征在于：还包括智能切换控制器，所述智能切换控制器根据用户的对话环境和需求，智能调度预生成话术装载器和实时话术生成器；当用户开始对话时，智能切换控制器首先判断用户所处的场景和语境，然后调用相应领域的预生成话术集；对于复杂或特定需求的对话，智能切换控制器切换到实时话术生成器，生成贴近语境
、
满足需求的话术
。5.
如权利要求1所述的装置，其特征在于：包括数字人
API
服务模块
、
场景话术预判模块
、
预生成话术服务模块
、
实时话术服务模块
、
智能语音交互模块以及模拟人类口型服务模块，数字人
API
服务模块的输入端连接用户端，数字人
API
服务模块的输出端连接场景话术预判模块，场景话术预判模块内设置有大语言模型和向量数据库，并预判有无预生成话术，若有预生成话术则发送至预生成话术服务模块，若无预生成话术则发送至实时话术服务模块，预生成话术服务模块
、
实时话术服务模块分别将文字合成音频传输至智能语音交互模块，由智能语音交互模块...

【专利技术属性】
技术研发人员：彭维玮，
申请(专利权)人：上海数珩信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人