【技术实现步骤摘要】
本申请涉及信息处理,特别是涉及一种数据生成方法、装置、设备及可读存储介质。
技术介绍
1、api文档和使用指南通常针对专家领域,其目的是为了准确描述api的功能并避免产生歧义。为此,通常使用标准化的语言和统一的格式来对api进行描述和定义。然而,当普通用户或非专业用户使用api时,他们往往面临理解上的巨大障碍,必须通过查阅文档来理解api的功能和用法。这种理解鸿沟显著增加了他们正确调用api的难度。
2、目前,通过自然语言控制api的调用和参数设置。由于自然语言处理(nlp,naturallanguage processing)技术的发展,使得模型的语义理解与代码的对齐更加精准。然而,虽然模型在广泛领域内具备了出色的泛化能力,但对于定制化api功能,基础模型的数据往往难以覆盖。这时,需要通过大量任务数据来进一步预训练或监督微调(sft,supervisedfine-tuning),以增强模型对特定领域的理解。
3、为了使生成式模型(如gpt)掌握特定领域的api,必须通过大量的含有指令结果对(包括输入指令与api
...【技术保护点】
1.一种数据生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在不同颗粒度下对应用程序编程接口进行拆分,得到多个应用程序编程子接口,包括:
3.根据权利要求1所述的方法,其特征在于,在所述分布数据与所述生成比例不匹配的情况下,还包括:
4.根据权利要求3所述的方法,其特征在于,通过重新获取新的提示词对所述数据集进行补充,包括:
5.根据权利要求1所述的方法,其特征在于,基于统计结果,确定生成比例,包括:
6.根据权利要求1至5任一项所述的方法,其特征在于,利用所述配置信息,确定所述生成比
<...【技术特征摘要】
1.一种数据生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在不同颗粒度下对应用程序编程接口进行拆分,得到多个应用程序编程子接口,包括:
3.根据权利要求1所述的方法,其特征在于,在所述分布数据与所述生成比例不匹配的情况下,还包括:
4.根据权利要求3所述的方法,其特征在于,通过重新获取新的提示词对所述数据集进行补充,包括:
5.根据权利要求1所述的方法,其特征在于,基于统计结果,确定生成比例,包括:<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。