数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：39249004 阅读：11 留言：0更新日期：2023-10-30 12:01

本申请提供了一种数据处理方法、装置、计算机设备和存储介质。该方法包括：在用户与对话模型进行交互的过程中，按照交互的时间顺序将新增的会话内容添加到第一会话集中；对话模型用于根据第一提示词生成会话内容，第一提示词基于记忆模块和第一会话集生成；判断第一会话集是否满足记忆更新条件；若是，则将第一会话集中位于会话分割点之前的数据分离出来，得到第二会话集；根据第二会话集和当前的记忆模块生成第二提示词，并将第二提示词输入记忆提取模型，以得到更新后的记忆模块。本申请使得对话模型在关键信息没有丢失的前提下保留了长期记忆，克服了历史性遗忘缺点。克服了历史性遗忘缺点。克服了历史性遗忘缺点。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质

[0001]本申请涉人工智能
，尤其涉及一种数据处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]对话模型是一种能够根据给定的上下文，生成自然语言对话的人工智能系统。对话模型有多种应用场景，例如智能客服、聊天机器人、教育辅导等。对话模型的核心技术是语言生成，即如何从语义表示或历史信息中生成流畅、合理、有趣的对话。
[0003]然而由于受制于模型所能处理的最大文本长度限制，会话模型与用户之间不断地进行信息交互，会产生大量聊天数据。而现有的大模型受限于处理文本长度上限，无法处理太长的历史会话消息，不适合长期聊天等场景。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一，特别是现有技术中对话模型无法保持长期记忆的问题。
[0005]第一方面，本申请提供了一种数据处理方法，包括：
[0006]在用户与对话模型进行交互的过程中，按照交互的时间顺序将新增的会话内容添加到第一会话集中；对话模型用于根据第一提示词生成会话内容，第一提示词基于记忆模块和第一会话集生成；
[0007]判断第一会话集是否满足记忆更新条件；
[0008]若是，则将第一会话集中位于会话分割点之前的数据分离出来，得到第二会话集；
[0009]根据第二会话集和当前的记忆模块生成第二提示词，并将第二提示词输入记忆提取模型，以得到更新后的记忆模块。
[0010]在其中一个实施中，判断第一会话集是否满足记忆更新条件，包...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：在用户与对话模型进行交互的过程中，按照交互的时间顺序将新增的会话内容添加到第一会话集中；所述对话模型用于根据第一提示词生成会话内容，所述第一提示词基于记忆模块和所述第一会话集生成；判断所述第一会话集是否满足记忆更新条件；若是，则将所述第一会话集中位于会话分割点之前的数据分离出来，得到第二会话集；根据所述第二会话集和当前的所述记忆模块生成第二提示词，并将所述第二提示词输入记忆提取模型，以得到更新后的所述记忆模块。2.根据权利要求1所述的数据处理方法，其特征在于，所述判断所述第一会话集是否满足记忆更新条件，包括：获取所述第一会话集中的词元数量；在所述词元数量大于更新阈值的情况下，判定所述第一会话集满足所述记忆更新条件。3.根据权利要求2所述的数据处理方法，其特征在于，在所述将所述第一会话集中位于会话分割点之前的数据分离出来之前，还包括：根据所述更新阈值，设置所述会话分割点。4.根据权利要求3所述的数据处理方法，其特征在于，所述根据所述更新阈值，设置所述会话分割点，包括：在所述第一会话集中，定位与所述更新阈值对应的词元，并以定位到的词元为目标词元、所述目标词元所在的段落为目标段；若所述目标段由所述用户发出，则将所述会话分割点设置在所述目标段的起始词元之前；若所述目标段由所述对话模型发出，则将所述会话分割点设置在所述目标段的结尾词元之后。5.根据权利要求1
‑
4任一项所述的数据处理方法，其特征在于，所述根据所述第二会话集和当前的所述记忆模块生成第二提示词，包括：根据所述第二会话集和当前的所述记忆模块，生成提取材料提示词；根据提取设定，确定提取目标提示词；所述提取目标提示词用于指示所述记忆提取模型从所述提取材料提示词...

【专利技术属性】
技术研发人员：邓其春，马金龙，吴文亮，熊佳，张政统，黎子骏，曾锐鸿，王伟喆，盘子圣，兰翔，徐志坚，谢睿，陈光尧，
申请(专利权)人：广州趣研网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人