数据集的生成方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:43082467 阅读:26 留言:0更新日期:2024-10-26 09:32
本发明专利技术实施例提供了数据集的生成方法、装置、设备、存储介质及程序产品。本发明专利技术实施例属于人工智能技术领域。通过第一智能代理基于知识片段以及设定问题标准生成第一目标问题;通过第二智能代理基于所述知识片段、所述第一目标问题以及设定答案标准生成所述第一目标问题对应的第一目标答案;通过第三智能代理基于知识片段、第一目标问题、第一目标答案以及设定评分标准生成目标评分标准对应的第二目标问题以及对应的第二目标答案;基于目标评分标准对应的第二目标问题以及第二目标问题对应的第二目标答案形成数据集。本公开实施例,用于生成高质量的数据集,可以解决现有技术中数据集标注耗时且成本高、数据集质量差的问题。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种数据集的生成方法、装置、设备、存储介质及程序产品


技术介绍

1、通用大模型通常在大规模的通用数据集上进行预训练,这导致它们在特定行业或领域内知识不足。特殊领域往往需要深入的专业知识,而通用模型无法很好地理解和处理这些专业知识。因此,为了更好的将通用模型应用于特定领域,微调是最有效的方式之一,然而,目前现有大模型微调数据集具有很多缺陷,例如:数据集标注耗时且成本高;数据质量参差不齐,无法保证数据集的高质量。


技术实现思路

1、本专利技术提供一种数据集的生成方法、装置、设备、存储介质及程序产品,可以提高生成数据集的质量,同时降低生成数据集的时间以及成本。

2、第一方面,本公开实施例提供了一种数据集的生成方法,包括:通过第一智能代理基于知识片段以及设定问题标准生成第一目标问题;通过第二智能代理基于所述知识片段、所述第一目标问题以及设定答案标准生成所述第一目标问题对应的第一目标答案;通过第三智能代理基于所述知识片段、所述第一目标问题、所述第一目标问题对应的第一目标答案本文档来自技高网...

【技术保护点】

1.一种数据集的生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,通过第一智能代理基于知识片段以及设定问题标准生成第一目标问题,包括:

3.根据权利要求1所述的方法,其特征在于,通过第二智能代理基于所述知识片段、所述第一目标问题以及设定答案标准生成所述第一目标问题对应的第一目标答案,包括:

4.根据权利要求1所述的方法,其特征在于,通过第三智能代理基于所述知识片段、所述第一目标问题、所述第一目标问题对应的第一目标答案以及设定评分标准生成目标评分标准对应的第二目标问题以及所述第二目标问题对应的第二目标答案,包括:

5.根...

【技术特征摘要】

1.一种数据集的生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,通过第一智能代理基于知识片段以及设定问题标准生成第一目标问题,包括:

3.根据权利要求1所述的方法,其特征在于,通过第二智能代理基于所述知识片段、所述第一目标问题以及设定答案标准生成所述第一目标问题对应的第一目标答案,包括:

4.根据权利要求1所述的方法,其特征在于,通过第三智能代理基于所述知识片段、所述第一目标问题、所述第一目标问题对应的第一目标答案以及设定评分标准生成目标评分标准对应的第二目标问题以及所述第二目标问题对应的第二目标答案,包括:

5.根据权利要求1所述的方法,其特征在于,在通过第一智能代理基于知识片段以及设定问题标准生成第一目标问题之前,还包括:

6.根据权利要求1所述的方法,其特征在于,其中,所述第一智能代理、所述...

【专利技术属性】
技术研发人员:檀才东卜民胡琼
申请(专利权)人:阳光电源股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1