【技术实现步骤摘要】
一种用于LLM模型的数据训练方法及存储介质
[0001]本专利技术涉及大语言模型训练
,特别是涉及一种用于
LLM
模型的数据训练方法及存储介质
。
技术介绍
[0002]大语言模型
LLM
是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义;大语言模型可以处理多种自然语言任务,如文本分类
、
问答
、
对话等
。
目前,随着
ChatGPT
的迅速发展,使用
ChatGPT
或其它大语言模型进行问答获取到想要的问题或答案的需求越来越多,如何对大语言模型进行训练或引导使得大语言模型输出想要的答案至关重要
。
技术实现思路
[0003]针对上述技术问题,本专利技术采用的技术方案为:一种用于
LLM
模型的数据训练方法,所述方法包括如下步骤:
S100
,获取训练用文本集
A={A1,
A2,
…
,
A
i
,
…
,
A
m
}
,
A
i
是第
i
条训练用文本,
i
的取值范围是1到
m
,
m
是训练用文本的数量,所述训练用文本
A
i
包括目标领域中关于同一预设场景的
p
...
【技术保护点】
【技术特征摘要】
1.
一种用于
LLM
模型的数据训练方法,其特征在于,所述方法包括如下步骤:
S100
,获取训练用文本集
A={A1,
A2,
…
,
A
i
,
…
,
A
m
}
,
A
i
是第
i
条训练用文本,
i
的取值范围是1到
m
,
m
是训练用文本的数量,所述训练用文本
A
i
包括目标领域中关于同一预设场景的
p
个第一语句和
p+1
个第二语句,其中,
A
i
中第
q
个第二语句是根据第
q
个第一语句提出的问题语句,第
q
个第一语句为关于预设场景的陈述语句,且同时为第
q
‑1个第二语句的回答语句,
q
的取值范围是1到
p
,且当
q=1
时,第
q
个第一语句为关于预设场景的陈述语句;所述预设场景为所述目标领域中多个指定场景中的一个;
S200
,基于特定字符,对
A
中每一训练用文本进行划分,获取中间问答文本列表
B={B1,
B2,
…
,
B
j
,
…
,
B
n
}
,
B
j
是第
j
个中间问答文本,
j
的取值范围是1到
n
,
n
是训练用文本集
A
中所有训练用文本进行划分后的中间问答文本的数量;其中,
B
j
={AB
j
,
QB
j
}
,
AB
j
是第
j
个中间问答文本
B
j
包含的回答语句,
QB
j
是第
j
个中间问答文本
B
j
包含的问题语句,
QB
j
是基于
AB
j
提出的问题语句;
S300
,将第一指令和中间问答文本列表
B
输入
LLM
模型,获取
LLM
模型输出的第一预测问题语句列表
QC={QC1,
QC2,
…
,
QC
j
,
…
,
QC
n
}
,所述第一指令为:基于
AB
j
生成问题语句;
QC
j
是
LLM
模型输出的
AB
j
对应的第一预测问题语句;
S400
,遍历
QC
,若存在
QC
j
属于黑名单列表,将第二指令输入
LLM
模型,获取
LLM
模型输出的第二预测问题语句
QD
j
,将第二预测问题语句
QD
j
替换
QB
j
,获取
E
j
={AB
j
,
QD
j
}
;所述黑名单列表为预设的无意义语句列表;所述第二指令为:基于
AB
j
和
k
条领域摘要语句生成问题语句;所述领域摘要语句是目标领域内的预设语句;
S500
,获取最终文本列表
F={F1,
F2,
…
,
F
j
,
…
,
F
n
}
,将第一指令和最终文本列表
F
输入
LLM
模型,对
LLM
模型进行训练;其中,
F
j
是第
j
个最终文本,若
QC
j
属于黑名单列表,
F
j
=E
j
;若
QC
j
不属于黑名单列表,
F
j
=B
j
。2.
根据权利要求1所述的用于
LLM
模型的数据训练方法,其特征在于,
S500
具体包括如下步骤:
S510
,获取最终文本列表
F
且将最终文本列表
F
分为
s1
个训练集和
s2
个测试集;
S520
,利用
s1
个训练集对
LLM
模型进行训练,获取训练后的
LLM
模型;
S530
,对训练后的
LLM
模型进行评估,若评估结果满足第一预设条件,则将所述训练后的
LLM
模型确定为待测试
LLM
模型;
S540
,将
s2
个测试集输入所述待测试
LLM
模型中,获取测试结果;
S550
,当测试结果满足第二预设条件时,将训练后的
LLM
模型确定为目标
LLM
模型
。3.
根据权利要求1所述的用于
LLM
模型的数据训练方法,其特征在于,还包括:
S001
,获取历史用文本集
G={G1,
G2,
…
,
G
r
,
…
,
G
s
}
,
G
r
是第
r
个历史用文本,
r
的取值范围是1到
s
,
s
是历史用文本的数量,所述历史用文本
G
r
包括目标领域中关于同一预设场景的
h
个第三语句和
h+1
个第四语句,其中,
G
r
中第
α
个第四语句是根据第
α
个第三语句提出的问题语句,第
α
个第三语句为关于预设场景的陈述语句,且同时为第
α
‑1个第四语句的回答语句;
α
的取值范围是1到
h
,且当
α
=1
时,第
α
个第三语句为关于预设场景的陈述语句;
S002
,遍历
G
,对历史用文本
G
r
中每一历史用文本进行划分得到
G
r
,1,
G
r
,2,
…
,
G
r
,
g
,
…
,
G
r
,
zr
,其中,
G
r
,
g
是
G
r
划分后的第
g
个简单问答文本,
g
的取值范围是1到
【专利技术属性】
技术研发人员:靳雯,于伟,王全修,石江枫,赵洲洋,吴凡,
申请(专利权)人:日照睿安信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。