一种问答对的生成方法和系统技术方案

技术编号:39833799 阅读:7 留言:0更新日期:2023-12-29 16:17
本申请提供了一种问答对的生成方法和系统

【技术实现步骤摘要】
一种问答对的生成方法和系统、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种问答对的生成方法和系统

电子设备及存储介质


技术介绍

[0002]聊天生成式预训练转换器
(Chat Generative Pre

trained Transformer

ChatGPT)
是一款基于自然语言处理的聊天机器人产品,其本质是一个基于
GPT
的语言模型

其经过指令微调和偏好学习两个阶段的训练,具备了近乎人类的交互能力

[0003]目前,
ChatGPT
等大语言模型依旧缺乏对垂直领域场景的高效支持,当需要将
ChatGPT
等大语言模型用在垂直
时,常常需要以人工标注的方式来构建多个指令数据
(
即问答对
)
,利用指令数据对大语言模型进行微调,以使经过微调的大语言模型能用于到某个具体领域,但是,大量的指令数据的标注会产生较大的标注成本,且会造成指令数据的生成效率低下的问题


技术实现思路

[0004]本专利技术实施例提供了一种问答对的生成方法和系统

电子设备及存储介质,旨在降低生成目标领域的问答对的成本,提高问答对的生成效率

[0005]为实现上述目的,本申请实施例的第一方面提出了一种问答对的生成方法,所述方法包括:
[0006]获取目标领域的文本数据集,其中,所述文本数据集包括至少一个所述目标领域的目标文本;
[0007]基于预设的第一模板和所述目标文本进行文本生成,得到第一提示文本;
[0008]基于预设的第一模型对所述第一提示文本进行问题生成,得到第一问题;
[0009]基于预设的第二模板

所述目标文本和所述第一问题进行文本生成,得到第二提示文本;
[0010]基于预设的第二模型对所述第二提示文本进行答案生成,得到与所述第一问题对应的第一答案;
[0011]基于所述第一问题和所述第一答案,生成所述目标文本的目标问答对

[0012]在一些实施例,所述目标问答对包括第一问题

和第一答案;
[0013]在所述生成所述目标文本的目标问答对之后,所述方法还包括:
[0014]将所述第一问题输入至所述第二模型进行答案生成,得到预测答案;
[0015]将所述第一答案输入至所述第一模型进行问题生成,得到预测问题;
[0016]基于所述预测答案

所述预测问题

所述第一问题

和所述第一答案对所述目标问答对进行更新

[0017]在一些实施例,所述基于所述预测答案

所述预测问题

所述第一问题

和所述第一答案对所述目标问答对进行更新,包括:
[0018]基于所述预测问题和所述预测答案,确定第一问答评分数据;
[0019]基于所述第一问题和所述第一答案,确定第二问答评分数据;
[0020]如果确定所述第一问答评分数据大于所述第二问答评分数据,则对所述目标问答对进行更新

[0021]在一些实施例,所述对所述目标问答对进行更新,包括:
[0022]将所述目标问答对中的所述第一问题替换成所述预测问题;
[0023]将所述目标问答对中的所述第一答案替换成所述预测答案

[0024]在一些实施例,所述预测问题中的每个字符具有第一概率,所述预测答案中的每个字符具有第二概率;
[0025]所述基于所述预测问题和所述预测答案,确定第一问答评分数据,包括:
[0026]基于所述第一概率对所述预测问题进行问题质量评分,得到问题质量分数;
[0027]基于所述问题质量分数和所述第一概率对所述预测问题进行稳定性评分,得到问题稳定性分数;
[0028]基于所述第二概率对所述预测答案进行答案质量评分,得到答案质量分数;
[0029]基于所述答案质量分数和所述第二概率对所述预测答案进行稳定性评分,得到答案稳定性分数;
[0030]基于所述问题质量分数和所述问题稳定性分数的乘积

所述答案质量分数和所述答案稳定性分数的乘积,得到所述第一问答评分数据

[0031]在一些实施例,所述基于所述第一概率对所述预测问题进行问题质量评分,得到问题质量分数,包括:
[0032]确定所述预测问题的句子长度;
[0033]基于所述句子长度,对所述预测问题的每个字符的所述第一概率求平均,得到所述问题质量分数

[0034]在一些实施例,所述基于所述问题质量分数和所述第一概率对所述预测问题进行稳定性评分,得到问题稳定性分数,包括:
[0035]针对所述预测问题的每个字符,计算所述字符的所述第一概率和所述问题质量分数的差的平方,得到所述字符的子分数;
[0036]基于所述预测问题的句子长度,对多个所述字符的子分数进行求平均,得到所述问题稳定性分数

[0037]为实现上述目的,本申请实施例的第二方面提出了一种问答对的生成系统,所述系统包括:
[0038]文本数据集获取模块,用于获取目标领域的文本数据集,其中,所述文本数据集包括至少一个所述目标领域的目标文本;
[0039]第一提示文本生成模块,用于基于预设的第一模板和所述目标文本进行文本生成,得到第一提示文本;
[0040]第一问题生成模块,用于基于预设的第一模型对所述第一提示文本进行问题生成,得到第一问题;
[0041]第二提示文本生成模块,用于基于预设的第二模板

所述目标文本和所述第一问题进行文本生成,得到第二提示文本;
[0042]第一答案生成模块,用于基于预设的第二模型对所述第二提示文本进行答案生成,得到与所述第一问题对应的第一答案;
[0043]目标问答对生成模块,用于基于所述第一问题和所述第一答案,生成所述目标文本的目标问答对

[0044]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括处理器

通信接口

存储器和通信总线,所述处理器

通信接口

和存储器通过通信总线完成相互间的通信,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法

[0045]为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法

[0046]本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种问答对的生成方法,其特征在于,所述方法包括:获取目标领域的文本数据集,其中,所述文本数据集包括至少一个所述目标领域的目标文本;基于预设的第一模板和所述目标文本进行文本生成,得到第一提示文本;基于预设的第一模型对所述第一提示文本进行问题生成,得到第一问题;基于预设的第二模板

所述目标文本和所述第一问题进行文本生成,得到第二提示文本;基于预设的第二模型对所述第二提示文本进行答案生成,得到与所述第一问题对应的第一答案;基于所述第一问题和所述第一答案,生成所述目标文本的目标问答对
。2.
根据权利要求1的一种问答对的生成方法,其特征在于,所述目标问答对包括第一问题

和第一答案;在所述生成目标文本的目标问答对之后,所述方法还包括:将所述第一问题输入至所述第二模型进行答案生成,得到预测答案;将所述第一答案输入至所述第一模型进行问题生成,得到预测问题;基于所述预测答案

所述预测问题

所述第一问题

和所述第一答案对所述目标问答对进行更新
。3.
根据权利要求2的一种问答对的生成方法,其特征在于,基于所述预测答案

所述预测问题

所述第一问题

和所述第一答案对所述目标问答对进行更新,包括:基于所述预测问题和所述预测答案,确定第一问答评分数据;基于所述第一问题和所述第一答案,确定第二问答评分数据;如果确定所述第一问答评分数据大于所述第二问答评分数据,则对所述目标问答对进行更新
。4.
根据权利要求3的一种问答对的生成方法,其特征在于,所述对所述目标问答对进行更新,包括:将所述目标问答对中的所述第一问题替换成所述预测问题;将所述目标问答对中的所述第一答案替换成所述预测答案
。5.
根据权利要求3的一种问答对的生成方法,其特征在于,所述预测问题中的每个字符具有第一概率,所述预测答案中的每个字符具有第二概率;所述基于所述预测问题和所述预测答案,确定第一问答评分数据,包括:基于所述第一概率对所述预测问题进行问题质量评分,得到问题质量分数;基于所述问题质量分数和所述第一概率对所述预测问题进行稳定性评分,得到问题稳定性分数;基于所述第二概率对所述预测答案进行答案质量评分,得到答案质量分数;基于所述答案质量分...

【专利技术属性】
技术研发人员:陈焕坤王伟董坤磊肖海山
申请(专利权)人:华润数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1