一种问答对的生成方法和系统技术方案

技术编号：39833799 阅读：7 留言：0更新日期：2023-12-29 16:17

本申请提供了一种问答对的生成方法和系统

全部详细技术资料下载

【技术实现步骤摘要】
一种问答对的生成方法和系统、电子设备及存储介质

[0001]本专利技术涉及人工智能领域，尤其涉及一种问答对的生成方法和系统
、
电子设备及存储介质
。

技术介绍

[0002]聊天生成式预训练转换器
(Chat Generative Pre
‑
trained Transformer
，
ChatGPT)
是一款基于自然语言处理的聊天机器人产品，其本质是一个基于
GPT
的语言模型
。
其经过指令微调和偏好学习两个阶段的训练，具备了近乎人类的交互能力
。
[0003]目前，
ChatGPT
等大语言模型依旧缺乏对垂直领域场景的高效支持，当需要将
ChatGPT
等大语言模型用在垂直
时，常常需要以人工标注的方式来构建多个指令数据
(
即问答对
)
，利用指令数据对大语言模型进行微调，以使经过微调的大语言模型能用于到某个具体领域，但是，大量的指令数据的标注会产生较大的标注成本，且会造成指令数据的生成效率低下的问题
。

技术实现思路

[0004]本专利技术实施例提供了一种问答对的生成方法和系统
、
电子设备及存储介质，旨在降低生成目标领域的问答对的成本，提高问答对的生成效率
。
[0005]为实现上述目的，本申请实施例的第一方面提出了一种问答对的生成方法，所述方法包括：
[...

【技术保护点】

【技术特征摘要】
1.
一种问答对的生成方法，其特征在于，所述方法包括：获取目标领域的文本数据集，其中，所述文本数据集包括至少一个所述目标领域的目标文本；基于预设的第一模板和所述目标文本进行文本生成，得到第一提示文本；基于预设的第一模型对所述第一提示文本进行问题生成，得到第一问题；基于预设的第二模板
、
所述目标文本和所述第一问题进行文本生成，得到第二提示文本；基于预设的第二模型对所述第二提示文本进行答案生成，得到与所述第一问题对应的第一答案；基于所述第一问题和所述第一答案，生成所述目标文本的目标问答对
。2.
根据权利要求1的一种问答对的生成方法，其特征在于，所述目标问答对包括第一问题
、
和第一答案；在所述生成目标文本的目标问答对之后，所述方法还包括：将所述第一问题输入至所述第二模型进行答案生成，得到预测答案；将所述第一答案输入至所述第一模型进行问题生成，得到预测问题；基于所述预测答案
、
所述预测问题
、
所述第一问题
、
和所述第一答案对所述目标问答对进行更新
。3.
根据权利要求2的一种问答对的生成方法，其特征在于，基于所述预测答案
、
所述预测问题
、
所述第一问题
、
和所述第一答案对所述目标问答对进行更新，包括：基于所述预测问题和所述预测答案，确定第一问答评分数据；基于所述第一问题和所述第一答案，确定第二问答评分数据；如果确定所述第一问答评分数据大于所述第二问答评分数据，则对所述目标问答对进行更新
。4.
根据权利要求3的一种问答对的生成方法，其特征在于，所述对所述目标问答对进行更新，包括：将所述目标问答对中的所述第一问题替换成所述预测问题；将所述目标问答对中的所述第一答案替换成所述预测答案
。5.
根据权利要求3的一种问答对的生成方法，其特征在于，所述预测问题中的每个字符具有第一概率，所述预测答案中的每个字符具有第二概率；所述基于所述预测问题和所述预测答案，确定第一问答评分数据，包括：基于所述第一概率对所述预测问题进行问题质量评分，得到问题质量分数；基于所述问题质量分数和所述第一概率对所述预测问题进行稳定性评分，得到问题稳定性分数；基于所述第二概率对所述预测答案进行答案质量评分，得到答案质量分数；基于所述答案质量分...

【专利技术属性】
技术研发人员：陈焕坤，王伟，董坤磊，肖海山，
申请(专利权)人：华润数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人