【技术实现步骤摘要】
数据处理方法及装置、设备和介质
[0001]本公开涉及芯片
,尤其涉及数据处理
,具体涉及一种数据处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]人工智能模型存在大量的计算密集型算子,主要包括矩阵乘法,卷积,池化,激活等等。这些计算非常耗时,传统CPU的计算能力很难在性能上满足需求,因此异构计算成为了主流,包括GPU、FPGA、ASIC在内的各种人工智能处理器大量应用到了人工智能模型计算。同时,数据类型的选择对于人工智能计算的精度、性能等也起着十分重要的作用。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
技术实现思路
[0005]本公开提供了一种数据处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一种数据处理方法,包括:获取第 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:获取第一矩阵和第二矩阵,其中,所述第一矩阵和所述第二矩阵中的每个元素为第一数据格式,所述第一数据格式包括浮点类型;将所述第一矩阵划分为多个第一子矩阵,其中,所述多个第一子矩阵中的每个第一子矩阵中的元素的绝对值满足预设条件;针对所述多个第一子矩阵中的每个第一子矩阵,确定该第一子矩阵中绝对值最大的第一子元素,并将所述第一子元素的最大绝对值记为第一子矩阵最大值Max1;基于所述第一子矩阵最大值Max1,将该元素转换为第二数据格式的转换元素,所述第二数据格式包括n个尾数位,n为大于1的整数,并且其中,基于所述第一子矩阵最大值Max1,将该第一子矩阵中的每个元素映射到[0,2
n
]区间,以确定该元素对应的转换元素的尾数位;将所述第二矩阵划分为多个第二子矩阵,其中,所述多个第二子矩阵中的每个第二子矩阵中的元素的绝对值满足预设条件;针对所述多个第二子矩阵中的每个第二子矩阵,确定该第二子矩阵中绝对值最大的第二子元素,并将所述第二子元素的最大绝对值记为第二子矩阵最大值Max2;基于所述第二子矩阵最大值Max2,将该第二子矩阵中的每个元素映射到[0,2
n
]区间,以将该元素转换为第二数据格式的转换元素;以及基于所述第一矩阵和所述第二矩阵中的每个元素分别对应的转换元素,计算所述第一矩阵和所述第二矩阵的乘积。2.如权利要求1所述的方法,其中,根据所述预设条件,所述多个第一子矩阵中的每个第一子矩阵中的元素的绝对值的极差小于预设阈值。3.如权利要求1或2所述的方法,其中,所述第二数据格式还包括1个指数位,所述基于所述第一子矩阵最大值Max1,将该元素转换为对应的转换元素包括:基于所述第一子矩阵最大值Max1,确定第一分割点以将区间[0,Max1]分割为两个子区间;以及针对所述第一子矩阵中的每个元素,基于该元素所处的子区间,确定该元素对应的转换元素的指数位,并将该元素映射到[0,2
n
],以确定该元素对应的转换元素的尾数位。4.如权利要求3所述的方法,其中,所述基于所述第一子矩阵最大值Max1,确定分割点以将区间[0,Max1]分割为两个子区间包括:基于所述第一子矩阵最大值Max1,将所述第一分割点确定为以将区间[0,Max1]分割为两个子区间和5.如权利要求4所述的方法,其中,所述针对所述第一子矩阵中的每个元素,基于该元素所处的子区间,确定该元素对应的转换元素的指数位,并将该元素映射到[0,2
n
],以确定该元素对应的转换元素的尾数位包括:针对所述第一子矩阵中的每个元素,
确定该元素的绝对值a;响应于确定该元素位于子区间内,确定该元素对应的转换元素的指数位为0,并将该元素映射到[0,2
n
],以确定该元素对应的转换元素的尾数位为或响应于确定该元素位于子区间内,确定该元素对应的转换元素的指数位为1,并将该元素映射到[0,2
n
],以确定该元素转换为对应的转换元素的尾数位为6.如权利要求1
‑
5中任一项所述的方法,还包括:针对所述第一矩阵中的每个元素以及所述第二矩阵中的每个元素,确定该元素对应的恢复因数,其中,所述恢复因数满足于以下条件:该元素对应的转换元素乘以该元素对应的恢复因数等于该元素的绝对值,并且其中,所述基于所述第一矩阵和所述第二矩阵中的每个元素分别对应的转换元素,计算所述第一矩阵和所述第二矩阵的乘积包括:基于所述第一矩阵和所述第二矩阵中的每个元素分别对应的转换元素,计算所述第一矩阵和所述第二矩阵的乘积为第三矩阵,其中,所述第三矩阵中的每个元素的绝对值等于该元素在所述第一矩阵中对应的第三元素的转换元素的尾数位乘以该元素在所述第二矩阵中对应的第四元素的转换元素的尾数位乘以所述第三元素对应的恢复因数乘以所述第四元素对应的恢复因数。7.如权利要求6所述的方法,其中,所述第一数据格式和所述第二数据格式还包括1个符号位,所述第三矩阵中的每个元素的符号位为该元素在所述第一矩阵中对应的第三元素的符号位和该元素在所述第二矩阵中对应的第四元素的符号位的异或值。8.一种数据处理装置,包括:第一获取单元,被配置为获取第一矩阵和第二矩阵,其中,所述第一矩阵和所述第二矩阵中的每个元素为第一数据格式,所述第一数据格式包括浮点类型;划分单元,被配置为将所述第一矩阵划分为多个第一子矩阵,其中,所述多个第一子矩阵中的每个第一子矩阵中的元素的绝对值满足预设条...
【专利技术属性】
技术研发人员:邰秀瑢,陈庆澍,王勇,欧阳剑,王京,
申请(专利权)人:昆仑芯北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。