一种节省AI大模型推理算力的方法及装置制造方法及图纸

技术编号:41768279 阅读:16 留言:0更新日期:2024-06-21 21:46
本发明专利技术提供一种节省AI大模型推理算力的方法及装置,方法包括:接收用户的输入文本特征,以及上下文信息和用户状态信息;利用前端判别模块对输入文本特征进行初步分析,判断输入任务的难易程度,对输入任务进行智能识别和任务分流;采用模版匹配、规则匹配技术实现简单任务分流;构建和部署分类模型,对预设规则难以处理的输入任务进一步分析和判断;根据前端判别模块的判断结果,将输入任务合理地分配给传统NLU模型或大语言模型处理。本发明专利技术通过引入前端判别模块的和实施任务分流策略,能够实现算力的优化分配,有效提高了处理效率,保持任务处理的高准确率,并具有灵活性和扩展性等优点和积极效果,在自然语言处理领域具有广泛的应用前景。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,特别地,涉及ai大模型,人机交互;具体而言,涉及一种节省ai大模型推理算力的方法及装置。


技术介绍

1、在自然语言处理领域,ai大语言模型(llm模型)的发展已经取得了显著的进步,llm模型能够处理和理解复杂的自然语言文本。

2、然而,现有的这些llm模型通常需要大量的计算资源,尤其是在进行推理时,不论是简单任务还是复杂任务,不论输入任务的复杂程度如何,大语言模型往往都需要消耗相似的算力。

3、例如,对于输入“你好”两字这样的简单输入和输入一道复杂求解的数学题这样的复杂输入,ai大语言模型的算力消耗并没有显著差异,这在资源利用上是不合理的。

4、为降低ai大语言模型的推理成本,提高推理效率,现阶段尝试了多种方法,其中一种常见的方法是通过减少模型的参数规模,或者对模型进行压缩和剪枝,来降低算力消耗。

5、然而,现有的这种方法会导致ai大语言模型的准确率下降,无法充分发挥大模型的优势。此外,这种方法也不能解决简单任务和复杂任务消耗相似算力的问题。


<p>技术实现思本文档来自技高网...

【技术保护点】

1.一种节省AI大模型推理算力的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的节省AI大模型推理算力的方法,其特征在于,所述S2步骤的所述简单任务分流的预设规则包括以下任一种或多种的组合:

3.根据权利要求1所述的节省AI大模型推理算力的方法,其特征在于,所述S32步骤的对分类模型进行训练的方法包括以下步骤:

4.根据权利要求2所述的节省AI大模型推理算力的方法,其特征在于,所述S2步骤的模版匹配是使用预定义的规则和模式对输入任务进行匹配,判断输入任务是否属于简单任务,所述模版匹配包括以下步骤:

5.根据权利要求2所述的节省AI...

【技术特征摘要】

1.一种节省ai大模型推理算力的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的节省ai大模型推理算力的方法,其特征在于,所述s2步骤的所述简单任务分流的预设规则包括以下任一种或多种的组合:

3.根据权利要求1所述的节省ai大模型推理算力的方法,其特征在于,所述s32步骤的对分类模型进行训练的方法包括以下步骤:

4.根据权利要求2所述的节省ai大模型推理算力的方法,其特征在于,所述s2步骤的模版匹配是使用预定义的规则和模式对输入任务进行匹配,判断输入任务是否属于简单任务,所述模版匹配包括以下步骤:

5.根据权利要求2所述的节省ai大模型推理算力的方法,其特征在于,所述s2步骤的输入任务的难易程度包括以下几个等级:

6.一种节...

【专利技术属性】
技术研发人员:司玉景李全忠何国涛蒲瑶
申请(专利权)人:普强时代珠海横琴信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1