【技术实现步骤摘要】
本申请涉及人工智能(artificial intelligence,ai),尤其涉及一种模型处理方法及相关装置。
技术介绍
1、大语言模型(large language model,llm)的出现对于人工智能领域具有深远的意义。大语言模型所具有的出色的自然语言理解和生成能力,使得大语言模型在多种自然语言处理(natural language processing,nlp)任务展示出了强大的准确率和泛化性。
2、目前,大语言模型往往会结合prompting技术来使用。具体来说,prompting技术作为一项引导大语言模型在特定领域执行任务的技术,允许大语言模型以灵活的方式处理各类子任务,无需单独进行二次训练。在prompting技术中,用户通过构造一个“提示词”,即一段描述性文本,引导大语言模型理解任务需求和预期输出的格式。
3、在prompting技术中,提示词的设计对于大语言模型起到至关重要的作用,不同的提示词可能导致大语言模型输出质量的显著差异,即大语言模型的输入内容的质量会影响到大语言模型的输出内容的质量。
...【技术保护点】
1.一种模型处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述特征提取模型为嵌入Embedding模型,所述目标模型为大语言模型。
3.根据权利要求2所述的方法,其特征在于,所述目标模型不包括线性层,且所述目标模型是基于低秩适配器LoRA微调后得到的。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述特征提取模型所提取得到的特征具有固定的长度。
5.根据权利要求4任意一项所述的方法,其特征在于,所述融合特征是对所述第一特征与所述至少一个特征进行拼接得到的。
6.根据权利要求
...【技术特征摘要】
1.一种模型处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述特征提取模型为嵌入embedding模型,所述目标模型为大语言模型。
3.根据权利要求2所述的方法,其特征在于,所述目标模型不包括线性层,且所述目标模型是基于低秩适配器lora微调后得到的。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述特征提取模型所提取得到的特征具有固定的长度。
5.根据权利要求4任意一项所述的方法,其特征在于,所述融合特征是对所述第一特征与所述至少一个特征进行拼接得到的。
6.根据权利要求1-5任意一项所述的方法,其特征在于,所述至少一个特征为所述向量数据库中与所述第一特征相似度最高的k个特征,所述k为大于0的整数;
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述提示词包括多个模态下至少一个模态的数据,所述多个模态包括文本、语音、图像和视频;
8.根据权利要求1-7任意一项所述的方法,其特征在于,所述向量数据库用于存储由所述特征提取网络对多个知识文本进行特征提取所得到的多个特征。
9.根据权利要求1-8任意一项所述的方法,其特征在于,所述自然语言处理任务包括:智能问答任务、翻译任务、文本分类任务、文本分析任务或文本生成任务。
10.一种模型处理装置,其特征在于,包括:
11.根据权利要求10所述的装置,其特征在于,所述特征提取模型为嵌入embedding模型,所述目标模型为大语言模型。
12.根据权利要求11所述的装置,其特征在...
【专利技术属性】
技术研发人员:宋晓林,储贝林,刘振华,吴霖,任仁,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。