【技术实现步骤摘要】
本专利技术涉及自然语言处理,特别地,涉及ai大模型,人机交互;具体而言,涉及一种节省ai大模型推理算力的方法及装置。
技术介绍
1、在自然语言处理领域,ai大语言模型(llm模型)的发展已经取得了显著的进步,llm模型能够处理和理解复杂的自然语言文本。
2、然而,现有的这些llm模型通常需要大量的计算资源,尤其是在进行推理时,不论是简单任务还是复杂任务,不论输入任务的复杂程度如何,大语言模型往往都需要消耗相似的算力。
3、例如,对于输入“你好”两字这样的简单输入和输入一道复杂求解的数学题这样的复杂输入,ai大语言模型的算力消耗并没有显著差异,这在资源利用上是不合理的。
4、为降低ai大语言模型的推理成本,提高推理效率,现阶段尝试了多种方法,其中一种常见的方法是通过减少模型的参数规模,或者对模型进行压缩和剪枝,来降低算力消耗。
5、然而,现有的这种方法会导致ai大语言模型的准确率下降,无法充分发挥大模型的优势。此外,这种方法也不能解决简单任务和复杂任务消耗相似算力的问题。
【技术保护点】
1.一种节省AI大模型推理算力的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的节省AI大模型推理算力的方法,其特征在于,所述S2步骤的所述简单任务分流的预设规则包括以下任一种或多种的组合:
3.根据权利要求1所述的节省AI大模型推理算力的方法,其特征在于,所述S32步骤的对分类模型进行训练的方法包括以下步骤:
4.根据权利要求2所述的节省AI大模型推理算力的方法,其特征在于,所述S2步骤的模版匹配是使用预定义的规则和模式对输入任务进行匹配,判断输入任务是否属于简单任务,所述模版匹配包括以下步骤:
5.根据权利
...【技术特征摘要】
1.一种节省ai大模型推理算力的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的节省ai大模型推理算力的方法,其特征在于,所述s2步骤的所述简单任务分流的预设规则包括以下任一种或多种的组合:
3.根据权利要求1所述的节省ai大模型推理算力的方法,其特征在于,所述s32步骤的对分类模型进行训练的方法包括以下步骤:
4.根据权利要求2所述的节省ai大模型推理算力的方法,其特征在于,所述s2步骤的模版匹配是使用预定义的规则和模式对输入任务进行匹配,判断输入任务是否属于简单任务,所述模版匹配包括以下步骤:
5.根据权利要求2所述的节省ai大模型推理算力的方法,其特征在于,所述s2步骤的输入任务的难易程度包括以下几个等级:
6.一种节...
【专利技术属性】
技术研发人员:司玉景,李全忠,何国涛,蒲瑶,
申请(专利权)人:普强时代珠海横琴信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。