【技术实现步骤摘要】
用于向量内积的计算装置、方法和集成电路芯片
[0001]本披露一般地涉及浮点数向量内积运算领域。更具体地,本披露涉及用于浮点数向量内积运算的计算装置、方法、集成电路芯片和集成电路装置。
技术介绍
[0002]向量内积运算在计算机领域的应用十分普遍。以目前的热门应用领域人工智能中的主流算法机器学习算法为例,常见算法都使用了大量的向量内积运算。这类运算涉及到大量的乘加操作,而这些乘加装置或方法的安排直接影响了演算的速度。尽管现有的技术在执行效率方面获得了显著的提高,但在处理浮点数的内积上,还存在提升的空间。因此,如何获得一种高效率和低成本的模块来执行浮点数向量内积成为现有技术中需要解决的问题。
技术实现思路
[0003]为了至少部分地解决
技术介绍
中提到的技术问题,本披露的方案提供了一种用于进行浮点数向量内积的方法、集成电路芯片和装置。
[0004]在一个方面中,本披露提供一种用于执行向量内积运算的计算装置,包括乘法单元及加法模块。乘法单元包括一个或多个浮点乘法器,该浮点乘法器配置用于对接收到的第一向量和第二向量执行对应向量元素的乘法操作,以获得每一对的对应向量元素的乘积结果,其中所述第一向量和第二向量各自包括一个或多个所述向量元素。加法模块配置用于对所述第一向量和第二向量的对应向量元素的乘积结果执行加法操作,以获得求和结果。
[0005]前述的计算装置进一步包括更新模块,其配置用于响应于所述求和结果是所述内积运算的中间结果,执行针对产生的多个所述中间结果的多次加法操作,以输出所述内积运算的 ...
【技术保护点】
【技术特征摘要】
1.一种用于执行向量内积运算的计算装置,包括:乘法单元,其包括一个或多个浮点乘法器,该浮点乘法器配置用于对接收到的第一向量和第二向量执行对应向量元素的乘法操作,以获得每一对的对应向量元素的乘积结果,其中所述第一向量和第二向量各自包括一个或多个所述向量元素;以及加法模块,其配置用于对所述第一向量和第二向量的所述对应向量元素的乘积结果执行加法操作,以获得求和结果。2.根据权利要求1所述的计算装置,进一步包括:更新模块,其配置用于响应于所述求和结果是所述内积运算的中间结果,执行针对产生的多个所述中间结果的多次加法操作,以输出所述内积运算的最终结果。3.根据权利要求2所述的计算装置,其中所述更新模块包括第二加法器和寄存器,所述第二加法器配置用于重复地执行以下操作,直至完成对全部所述多个中间结果的加法操作:接收来自于所述加法模块的中间结果和来自于所述寄存器的、前次加法操作的前次求和结果;将所述中间结果和所述前次求和结果进行相加,以获得本次加法操作的求和结果;以及利用本次加法操作的结果来更新所述寄存器中存储的前次求和结果。4.根据权利要求1所述的计算装置,其中:所述乘法单元输出所述乘积结果后,便接收下一对的对应向量元素进行乘法操作;所述加法模块输出所述求和结果后,便接收下一个来自所述乘法单元的乘积结果进行加法操作。5.根据权利要求1所述的计算装置,进一步包括:第一类型转换单元,其配置用于对所述乘积结果进行数据类型的转换,以便所述加法模块执行所述加法操作。6.根据权利要求5所述的计算装置,其中所述加法模块包括以多层级树状结构方式排列的多级加法器组,每级加法器组包括一个或多个第一加法器。7.根据权利要求6所述的计算装置,进一步包括布置在所述多级加法器组中的一个或多个第二类型转换单元,其配置用于将一级加法器组输出的数据转换成另一类型的数据,以用于后一级加法器组的加法操作。8.根据权利要求1-7的任意一项所述的计算装置,其中所述浮点乘法器用于根据运算模式进行浮点数乘法运算,其中所述第一向量和第二向量的所述对应向量元素至少包括指数和尾数,所述浮点乘法器包括:指数处理单元,用于根据所述运算模式、所述第一向量和第二向量的所述对应向量元素的指数来获得所述乘法运算后的指数;以及尾数处理单元,用于根据所述运算模式、所述第一向量和第二向量的所述对应向量元素来获得所述乘法运算后的尾数;其中,所述运算模式用于指示所述第一向量和第二向量的所述对应向量元素的数据格式。9.根据权利要求8所述的计算装置,其中所述运算模式还用于指示所述乘法运算后的数据格式。
10.根据权利要求8所述的计算装置,其中所述数据格式包括半精度浮点数、单精度浮点数、脑浮点数、双精度浮点数、自定义浮点数中的至少一种。11.根据权利要求8所述的计算装置,其中所述第一向量和第二向量的所述对应向量元素还包括符号,所述浮点乘法器进一步包括:符号处理单元,用于根据所述第一向量和第二向量的所述对应向量元素的符号获得乘法运算后的符号。12.根据权利要求11所述的计算装置,其中所述符号处理单元包括异或逻辑电路,所述异或逻辑电路用于根据所述第一向量和第二向量的所述对应向量元素的符号进行异或运算,获得所述乘法运算后的符号。13.根据权利要求8所述的计算装置,进一步包括:规格化处理单元,用于当所述第一向量和第二向量的所述对应向量元素为非规格化的非零浮点数时,根据所述运算模式,对所述第一向量和第二向量的所述对应向量元素进行规格化处理,以获得对应的指数和尾数。14.根据权利要求7所述的计算装置,其中所述尾数处理单元包括部分积运算单元和部分积求和单元,其中所述部分积运算单元用...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:安徽寒武纪信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。