基于自注意力的数据处理方法、装置、介质及终端制造方法及图纸

技术编号:40637600 阅读:35 留言:0更新日期:2024-03-13 21:20
本申请提供一种基于自注意力的数据处理方法、装置、介质及终端,通过TIF转换算法对所述浮点型查询矩阵、浮点型关键字矩阵进行二进制转换,并使用汉明距离来衡量比较二进制查询矩阵和二进制关键字矩阵中的每一个向量之间的相似度,是一种基于位运算的新型注意力机制,在保留全局特征提取能力的同时,减少了对高精度计算单元的需求,使得Transformer模型在处理数据享有高性能表现的同时降低了计算复杂度和难度,避免大规模的浮点数运算,提高了计算效率、降低能耗消耗并提高了计算准确性,这对于能量资源和计算能力有限的边缘设备至关重要。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种基于自注意力的数据处理方法、装置、介质及终端


技术介绍

1、大模型深度学习技术近几年备受关注,它在图像处理,自然语言处理等任务上都取得了良好的效果。但是大模型的推理和训练过程对计算资源要求很高,这导致大模型的使用变得非常昂贵,同时对诸如手机等计算能力有限的设备很不友好。

2、现在的深度学习大模型技术都以transformer模型为基础打造,transformer模型在图像处理、自然语言处理等很多领域有着广泛的应用。transformer模型中最重要的算法是自注意力算法,自注意力算法把每个输入的数据两两进行比较,通过内积的大小衡量他们的相似程度,然后依照他们的相似程度来对输出数据进行重新表示。

3、自注意力机制相比于之前的算法,拥有更好的捕捉长距离依赖的能力,同时拥有更好的并行度。但是,带来的代价是相比以前算法更加高昂的计算复杂度。由于需要对输入数据两两进行比较,所以带来了平方的复杂度,这带来了很多计算上的挑战。尤其是对于一些低计算精度的设备,很难在上面进行自注意力机制的部署。p>

4、现有的本文档来自技高网...

【技术保护点】

1.一种基于自注意力的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的基于自注意力的数据处理方法,其特征在于,所述基于二进制转换算法对所述浮点型查询矩阵、浮点型关键字矩阵进行二进制转换,以得到对应的二进制查询矩阵、二进制关键字矩阵,其二进制转换过程包括:

3.根据权利要求2所述的基于自注意力的数据处理方法,其特征在于,对所述浮点型查询矩阵、浮点型关键字矩阵进行线性量化处理,以得到对应的浮点型量化查询矩阵、浮点型量化关键字矩阵的获取方式包括:

4.根据权利要求2所述的基于自注意力的数据处理方法,其特征在于,所述二进制转换算法包括TIF转换算法;...

【技术特征摘要】

1.一种基于自注意力的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的基于自注意力的数据处理方法,其特征在于,所述基于二进制转换算法对所述浮点型查询矩阵、浮点型关键字矩阵进行二进制转换,以得到对应的二进制查询矩阵、二进制关键字矩阵,其二进制转换过程包括:

3.根据权利要求2所述的基于自注意力的数据处理方法,其特征在于,对所述浮点型查询矩阵、浮点型关键字矩阵进行线性量化处理,以得到对应的浮点型量化查询矩阵、浮点型量化关键字矩阵的获取方式包括:

4.根据权利要求2所述的基于自注意力的数据处理方法,其特征在于,所述二进制转换算法包括tif转换算法;所述tif转换算法的计算过程包括:

5.根据权利要求4所述的基于自注意力的数据处理方法,其特...

【专利技术属性】
技术研发人员:祝永新郑小盈段皋翔
申请(专利权)人:中国科学院上海高等研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1