游戏对话生成以及游戏对话模型的训练方法技术

技术编号:39721486 阅读:5 留言:0更新日期:2023-12-17 23:27
本发明专利技术提供一种游戏对话生成以及游戏对话模型的训练方法

【技术实现步骤摘要】
游戏对话生成以及游戏对话模型的训练方法、装置


[0001]本专利技术涉及数据处理
,尤其涉及一种游戏对话生成以及游戏对话模型的训练方法

装置


技术介绍

[0002]大语言模型
(Large Language Model

LLM)
出现了之后,提供了全新的

便捷的交互方式,即统一便捷的自然语言接口
。LLM
在文本生成

头脑风暴等各种复杂任务都取得了良好的效果,并在这些复杂任务中展现了强大的思维涌现能力,但其在对话游戏的部分任务效果一般

对话游戏任务包括石头剪刀布

猜数字

掷色子

接龙等重要任务

目前,主要是通过对大模型进行提示学习
(
构建
prompt)
,使得大模型可以完成很多任务,比如文本生成和理解

多轮对话等等

[0003]但是,目前传统的
prompt
的推理能力不足,导致针对石头剪刀布

猜数字等任务,用户和大模型对话,模型的复杂推理的能力不足,导致回答准确性不够


技术实现思路

[0004]本专利技术提供一种游戏对话生成以及游戏对话模型的训练方法

装置,用以解决现有技术中模型的复杂推理的能力不足,导致回答准确性不够的缺陷
>。
[0005]本专利技术提供一种游戏对话生成方法,包括:
[0006]获取目标游戏的历史对话;
[0007]基于目标游戏的游戏对话模型,生成所述历史对话的对话回复,所述目标游戏的游戏对话模型是基于所述目标游戏的思维链数据训练得到的,所述思维链数据是在所述目标游戏的原始对话中填充与所述目标游戏的游戏规则对应的推理数据得到的

[0008]根据本专利技术提供的一种游戏对话生成方法,所述思维链数据的获取步骤包括:
[0009]从所述原始对话中抽取所述目标游戏中各步骤的步骤对话,并在所述步骤对话中填充与所述目标游戏的游戏规则对应的推理数据,得到步骤推理对话;
[0010]基于所述目标游戏中各步骤的步骤推理对话,生成所述目标游戏的思维链数据

[0011]根据本专利技术提供的一种游戏对话生成方法,所述从所述原始对话中抽取所述目标游戏中各步骤的步骤对话,并在所述步骤对话中填充与所述目标游戏的游戏规则对应的推理数据,得到步骤推理对话,包括:
[0012]从所述目标游戏中各步骤的步骤对话中,筛选出处于所述目标游戏中间段的步骤游戏过程对话,作为中间步骤对话;
[0013]在所述中间步骤对话中填充与所述目标游戏的游戏规则对应的推理数据,得到步骤推理对话

[0014]根据本专利技术提供的一种游戏对话生成方法,所述基于所述目标游戏中各步骤推理对话,生成所述目标游戏的思维链数据,包括:
[0015]基于所述目标游戏中各步骤的执行顺序,组合所述目标游戏的思维链流程;
[0016]随机选取各步骤推理对话填入所述思维链流程中的对应步骤处,生成所述目标游戏的思维链数据

[0017]根据本专利技术提供的一种游戏对话生成方法,所述基于所述目标游戏中各步骤的执行顺序,组合所述目标游戏的思维链流程,包括:
[0018]对所述目标游戏中处于中间段的步骤进行循环,得到循环中间流程;
[0019]组合所述目标游戏中处于开头和结尾段的步骤,以及所述循环中间流程,得到所述目标游戏的思维链流程

[0020]根据本专利技术提供的一种游戏对话生成方法,所述游戏对话模型的训练步骤,包括:
[0021]基于所述思维链数据,以及所述原始对话,训练所述目标游戏的游戏对话模型

[0022]本专利技术还提供一种游戏对话生成装置,包括:
[0023]获取单元,获取目标游戏的历史对话;
[0024]生成单元,基于目标游戏的游戏对话模型,生成所述历史对话的对话回复,所述目标游戏的游戏对话模型是基于所述目标游戏的思维链数据训练得到的,所述思维链数据是在所述目标游戏的原始对话中填充与所述目标游戏的游戏规则对应的推理数据得到的

[0025]本专利技术还提供一种游戏对话模型的训练装置,包括:
[0026]数据采集单元,获取目标游戏的原始对话;
[0027]数据构造单元,在所述原始对话中填充与所述目标游戏的游戏规则对应的推理数据,得到所述目标游戏的思维链数据;
[0028]训练单元,基于所述思维链数据,训练所述目标游戏的游戏对话模型

[0029]本专利技术还提供一种电子设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述游戏对话生成方法,或,游戏对话模型的训练方法

[0030]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述游戏对话生成方法,或,游戏对话模型的训练方法

[0031]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述游戏对话生成方法,或,游戏对话模型的训练方法

[0032]本专利技术提供的游戏对话生成以及游戏对话模型的训练方法

装置,基于在原始对话中填充与目标游戏的游戏规则对应的推理数据,得到目标游戏的思维链数据,并基于思维链数据进行训练得到的游戏对话模型,进行游戏对话,生成对话回复,提升了对话回复的逻辑思维和准确性,进而大大提升了用户基于游戏对话模型进行游戏对话的使用体验

附图说明
[0033]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0034]图1是本专利技术提供的游戏对话生成方法的流程示意图;
[0035]图2是本专利技术提供的游戏对话模型的训练方法的流程示意图之一;
[0036]图3是本专利技术提供的生成思维链数据的流程示意图;
[0037]图4是本专利技术提供的游戏对话模型的训练方法的流程示意图之二;
[0038]图5是本专利技术提供的游戏对话生成装置的结构示意图;
[0039]图6是本专利技术提供的游戏对话模型的训练装置的结构示意图;
[0040]图7是本专利技术提供的电子设备的结构示意图

具体实施方式
[0041]为使本专利技术的目的

技术方案和优点更加清楚,下面将结合本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种游戏对话生成方法,其特征在于,包括:获取目标游戏的历史对话;基于目标游戏的游戏对话模型,生成所述历史对话的对话回复,所述目标游戏的游戏对话模型是基于所述目标游戏的思维链数据训练得到的,所述思维链数据是在所述目标游戏的原始对话中填充与所述目标游戏的游戏规则对应的推理数据得到的
。2.
根据权利要求1所述的游戏对话模型的训练方法,其特征在于,所述思维链数据的获取步骤包括:从所述原始对话中抽取所述目标游戏中各步骤的步骤对话,并在所述步骤对话中填充与所述目标游戏的游戏规则对应的推理数据,得到步骤推理对话;基于所述目标游戏中各步骤的步骤推理对话,生成所述目标游戏的思维链数据
。3.
根据权利要求2所述的游戏对话模型的训练方法,其特征在于,所述从所述原始对话中抽取所述目标游戏中各步骤的步骤对话,并在所述步骤对话中填充与所述目标游戏的游戏规则对应的推理数据,得到步骤推理对话,包括:从所述目标游戏中各步骤的步骤对话中,筛选出处于所述目标游戏中间段的步骤游戏过程对话,作为中间步骤对话;在所述中间步骤对话中填充与所述目标游戏的游戏规则对应的推理数据,得到步骤推理对话
。4.
根据权利要求2所述的游戏对话模型的训练方法,其特征在于,所述基于所述目标游戏中各步骤的步骤推理对话,生成所述目标游戏的思维链数据,包括:基于所述目标游戏中各步骤的执行顺序,组合所述目标游戏的思维链流程;随机选取各步骤推理对话填入所述思维链流程中的对应步骤处,生成所述目标游戏的思维链数据
。5.
根据权利要求4所述的游戏对话模型的训练方法,其特征在于,所述基于所述目标游戏中各步骤的执行顺序,组合所述目标游戏的思维链流程,包括:对所述目标游戏中处于中间段的步骤进行循环,得到循环中间流程;组合所述目标游戏中处于开头和结尾段的步骤,以及所述循环中间...

【专利技术属性】
技术研发人员:李亚张亚峰房翔黄雨昂尹忠诚刘权魏思王士进刘聪胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1