一种模型处理方法及相关装置制造方法及图纸

技术编号：46626403 阅读：0 留言：0更新日期：2025-10-14 21:23

一种模型处理方法，应用于人工智能技术领域。在该模型处理方法中，在获得原始的提示词后，通过特征提取模型对提示词进行特征提取，并基于提取得到的特征在向量数据库中进行检索，从而检索到与提示词的特征相似的其他特征。然后，将提示词的特征与检索到的其他特征进行融合后，输入到目标模型中进行处理，从而得到最终的任务结果。由于向量数据库中存储有大量内容所对应的特征，因此将检索到的特征与提示词的特征进行融合，能够得到蕴含大量知识内容的融合特征，从而提高目标模型的输入的质量，进而有效地提高目标模型输出结果的质量。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能(artificial intelligence，ai)，尤其涉及一种模型处理方法及相关装置。

技术介绍

1、大语言模型(large language model，llm)的出现对于人工智能领域具有深远的意义。大语言模型所具有的出色的自然语言理解和生成能力，使得大语言模型在多种自然语言处理(natural language processing，nlp)任务展示出了强大的准确率和泛化性。

2、目前，大语言模型往往会结合prompting技术来使用。具体来说，prompting技术作为一项引导大语言模型在特定领域执行任务的技术，允许大语言模型以灵活的方式处理各类子任务，无需单独进行二次训练。在prompting技术中，用户通过构造一个“提示词”，即一段描述性文本，引导大语言模型理解任务需求和预期输出的格式。

3、在prompting技术中，提示词的设计对于大语言模型起到至关重要的作用，不同的提示词可能导致大语言模型输出质量的显著差异，即大语言模型的输入内容的质量会影响到大语言模型的输出内容的质量。...

【技术保护点】

1.一种模型处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述特征提取模型为嵌入Embedding模型，所述目标模型为大语言模型。

3.根据权利要求2所述的方法，其特征在于，所述目标模型不包括线性层，且所述目标模型是基于低秩适配器LoRA微调后得到的。

4.根据权利要求1-3任意一项所述的方法，其特征在于，所述特征提取模型所提取得到的特征具有固定的长度。

5.根据权利要求4任意一项所述的方法，其特征在于，所述融合特征是对所述第一特征与所述至少一个特征进行拼接得到的。

6.根据权利要求1-5任意一项所述的...

【技术特征摘要】

1.一种模型处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述特征提取模型为嵌入embedding模型，所述目标模型为大语言模型。

3.根据权利要求2所述的方法，其特征在于，所述目标模型不包括线性层，且所述目标模型是基于低秩适配器lora微调后得到的。

4.根据权利要求1-3任意一项所述的方法，其特征在于，所述特征提取模型所提取得到的特征具有固定的长度。

5.根据权利要求4任意一项所述的方法，其特征在于，所述融合特征是对所述第一特征与所述至少一个特征进行拼接得到的。

6.根据权利要求1-5任意一项所述的方法，其特征在于，所述至少一个特征为所述向量数据库中与所述第一特征相似度最高的k个特征，所述k为大于0的整数；

7.根据权利要求1-6任意一项所述的方法，其特征在于，所述提示词包括多个模态下至少一个模态的数据，所述多个模态包括文本、语音、图像和视频；

8.根据权利要求1-7任意一项所述的方法，其特征在于，所述向量数据库用于存储由所述特征提取网络对多个知识文本进行特征提取所得到的多个特征。

9.根据权利要求1-8任意一项所述的方法，其特征在于，所述自然语言处理任务包括：智能问答任务、翻译任务、文本分类任务、文本分析任务或文本生成任务。

10.一种模型处理装置，其特征在于，包括：

11.根据权利要求10所述的装置，其特征在于，所述特征提取模型为嵌入embedding模型，所述目标模型为大语言模型。

12.根据权利要求11所述的装置，其特征在...

【专利技术属性】
技术研发人员：宋晓林，储贝林，刘振华，吴霖，任仁，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人