【技术实现步骤摘要】
本专利技术涉及大模型微调,具体地,涉及一种基于大模型的用户意图半自动化标注方法、系统、介质及设备。
技术介绍
1、生成式语言大模型作为一类强大的自然语言处理(nlp)模型,已成为目前的研究热点,其能够理解人类语言的含义和语法,同时也可以生成与输入数据相关的文本。对于无监督任务,模型可以生成文本、执行自然语言理解任务,如情感分析。对于有监督任务,可以进行文本分类、命名实体识别等,因此生成式大模型也越来越多的被应用于各种专业领域中。
2、然而由于大模型背后的预训练数据大多来自日常生活场景,缺少专业领域知识的学习,模型生成的结果也差强人意,于是越来越多的研究注重于对模型微调技术的处理。
3、大多数现有对于大模型微调的研究聚焦于微调指令的设计与数据的构建,而缺少对微调后大模型的评估工作。对于结构要求较高的标注数据,微调后的大模型直接运用于数据标注存在输出标注数据不规范的缺陷。
4、专利文献(申请号:cn202311059060.6)公开了一种基于问卷和大模型的医学队列随访对话辅助方法及系统,包括:医学知识图谱
...【技术保护点】
1.一种基于大模型的用户意图半自动化标注方法,其特征在于,包括:
2.根据权利要求1所述的基于大模型的用户意图半自动化标注方法,其特征在于,将以指定格式输入LLM0,得到专家微调后的大模型LLM1,表达式为:
3.根据权利要求2所述的基于大模型的用户意图半自动化标注方法,其特征在于,所述步骤5包括:
4.根据权利要求3所述的基于大模型的用户意图半自动化标注方法,其特征在于,所述步骤6包括:
5.一种基于大模型的用户意图半自动化标注系统,其特征在于,包括:
6.根据权利要求5所述的基于大模型的用户意图半自动化标
...【技术特征摘要】
1.一种基于大模型的用户意图半自动化标注方法,其特征在于,包括:
2.根据权利要求1所述的基于大模型的用户意图半自动化标注方法,其特征在于,将以指定格式输入llm0,得到专家微调后的大模型llm1,表达式为:
3.根据权利要求2所述的基于大模型的用户意图半自动化标注方法,其特征在于,所述步骤5包括:
4.根据权利要求3所述的基于大模型的用户意图半自动化标注方法,其特征在于,所述步骤6包括:
5.一种基于大模型的用户意图半自动化标注系统,其特征在于,包括:
6.根据权利要求5所述的基于大模型的用户意图半自动化标注系统,其特征在于,将以指定格式输入llm0,得到专家微调后的大...
【专利技术属性】
技术研发人员:朱能军,梁陈美锦,孙凌丹,陆羿勋,
申请(专利权)人:上海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。