数据处理方法及相关设备技术

技术编号:45859487 阅读:16 留言:0更新日期:2025-07-19 11:17
本申请公开了一种数据处理方法、相关设备,其中所述方法包括:获得第一数据,所述第一数据为大语言模型的输入数据;从多个第一可选模型中,确定出与第一数据的属性相匹配的第一目标模型,其中每个第一可选模型基于不同的预填充长度进行程序编译而得到,且各第一可选模型之间具有相同的模型参数;利用第一目标模型对所述第一数据进行大语言模型的预填充处理,得到对第一数据的预填充结果;基于预填充结果中的键值缓存结果以及首字输出词元,利用第二目标模型对所述第一数据进行大语言模型的解码处理,以得到用于回复第一数据的第二数据。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种数据处理方法、数据处理设备以及电子设备。


技术介绍

1、大语言模型(llm)是一种用于人工智能领域的模型,通常被用于推理场景。大语言模型的推理过程或阶段主要包括预填充阶段和解码阶段。其中,预填充阶段用于接收用户输入的要推理内容。解码阶段用于根据用户输入内容,对用户期望的输出进行推理。可见,如何提高推理效率成为了亟待解决的技术问题。


技术实现思路

1、本申请提供了一种数据处理方法、数据处理设备以及电子设备。

2、根据本申请的第一方面,提供了一种数据处理方法,包括:

3、获得第一数据,所述第一数据为大语言模型的输入数据;

4、从多个第一可选模型中,确定出与第一数据的属性相匹配的第一目标模型,其中每个第一可选模型基于不同的预填充长度进行程序编译而得到,且各第一可选模型之间具有相同的模型参数;

5、利用第一目标模型对所述第一数据进行大语言模型的预填充处理,得到对第一数据的预填充结果,所述预填充结果包括对第一数据的输入词元进行键值缓存的结果本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一数据包括N个第一子数据,N为大于或等于2的正整数,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述从多个第一可选模型中,确定出与第一数据的属性相匹配的第一目标模型,包括:

4.根据权利要求1所述的方法,其特征在于,还包括:

5.根据权利要求4所述的方法,其特征在于,所述第一数据包括N个第一子数据,N为大于或等于2的正整数,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述相同的模型参数保存或存储于参数存储空间...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一数据包括n个第一子数据,n为大于或等于2的正整数,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述从多个第一可选模型中,确定出与第一数据的属性相匹配的第一目标模型,包括:

4.根据权利要求1所述的方法,其特征在于,还包括:

5.根据权利要求4所述的方法,其特征在于,所述第一数据包括n个第一子数据,n为大于或等于2的正整数,所述方法还包括:

6.根据...

【专利技术属性】
技术研发人员:汤峰峰
申请(专利权)人:北京芯驰半导体科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1