【技术实现步骤摘要】
用于计算设备及其主机与装置的查找表压缩与读取方法
[0001]本专利技术涉及一种电子装置,且特别涉及一种用于计算设备及其主机与装置的查找表压缩方法与查找表读取方法。
技术介绍
[0002]对于许多应用而言,主机可能会传输大量数据给装置。以人工智能(artificial intelligence,AI)应用为例,计算机(主机)可能会传输大量数据给AI加速卡(装置)。AI加速卡可以使用这些大量数据进行复杂的AI算法,然后将演算结果回传给计算机。无论如何,主机与装置之间的传输带宽是有限的。如何减少主机与装置之间的数据传输量,是诸多重要课题之一。
[0003]预先存放了所述大量数据的查找表(look
‑
up table,LUT)可以被配置在装置中,以便减少主机与装置之间的数据传输量。举例来说,在人工智能模型(AI model)中,内嵌表(embedding table)被广泛应用于计算设备。对于大型模型而言,一笔数据可能长达上百个字节(byte)。透过将数据放进内嵌表(查找表)中,一个64位(bit)(亦即8个字节)的地址(索引)可以表示一笔上百个字节数据。主机可以将64位的地址传输给装置,而装置依据此地址在内嵌表中取出一笔上百个字节数据。因此,主机可以不用将一笔上百个字节数据传输给装置,以减少主机与装置之间的数据传输量。可想而知,装置需要具备大量的存储空间去存放所述内嵌表(查找表)。
技术实现思路
[0004]本专利技术提供一种查找表压缩方法与查找表读取方法,以及使用所述方法的计算 ...
【技术保护点】
【技术特征摘要】
1.一种查找表压缩方法,其特征在于,所述查找表压缩方法包括:以原表地址从原始查找表取出原始数据;以重组条件检查所述原始数据而获得检查结果;依照所述检查结果,将所述原始数据转换为经重组数据;以经压缩表地址将所述经重组数据写入经压缩查找表;以及将所述原表地址、所述经压缩表地址以及所述检查结果之间的关系写入映射表。2.根据权利要求1所述的查找表压缩方法,其特征在于,所述查找表压缩方法更包括:将所述映射表存放于主机;以及将所述经压缩查找表与所述重组条件存放于装置。3.根据权利要求2所述的查找表压缩方法,其特征在于,所述主机包括计算机,以及所述装置包括人工智能加速卡。4.根据权利要求1所述的查找表压缩方法,其特征在于,所述重组条件包括“n个字节为常数”,而检查所述原始数据的操作包括:当所述原始数据中的部份数据全为所述常数时,将所述检查结果中的对应位设为第一逻辑态,其中所述部份数据的数据长度为n个字节;以及当所述部份数据不全为所述常数时,将所述检查结果中的所述对应位设为第二逻辑态。5.根据权利要求4所述的查找表压缩方法,其特征在于,所述常数包括0,而n为2。6.根据权利要求1所述的查找表压缩方法,其特征在于,所述重组条件包括“n个字节小于阀值”,而检查所述原始数据的操作包括:当所述原始数据中的部份数据小于所述阀值时,将所述检查结果中的对应位设为第一逻辑态,其中所述部份数据的数据长度为n个字节;以及当所述部份数据不小于所述阀值时,将所述检查结果中的所述对应位设为第二逻辑态。7.根据权利要求6所述的查找表压缩方法,其特征在于,所述阀值包括0x03,而n为1。8.根据权利要求1所述的查找表压缩方法,其特征在于,将所述原始数据转换为经重组数据的操作包括:当所述检查结果表示所述原始数据中的部份数据符合所述重组条件时,舍弃所述部份数据;以及当所述检查结果表示所述部份数据不符合所述重组条件时,将所述部份数据保留于所述经重组数据中。9.一种计算设备,其特征在于,所述计算设备包括:装置;以及主机,以原表地址从原始查找表取出原始数据,其中所述主机以重组条件检查所述原始数据而获得检查结果,所述主机依照所述检查结果将所述原始数据转换为经重组数据,所述主机以经压缩表地址将所述经重组数据写入经压缩查找表,所述主机将所述原表地址、所述经压缩表地址以及所述检查结果之间的关系写入映射表,以及所述主机将所述经压缩查找表与所述重组条件存放于所述装置。10.根据权利要求9所述的计算设备,其特征在于,所述主机包括计算机,以及所述装置
包括人工智能加速卡。11.根据权利要求9所述的计算设备,其特征在于,所述重组条件包括“n个字节为常数”,当所述原始数据中的部份数据全为所述常数时,所述主机将所述检查结果中的对应位设为第一逻辑态,其中所述部份数据的数据长度为n个字节;以及当所述部份数据不全为所述常数时,所述主机将所述检查结果中的所述对应位设为第二逻辑态。12.根据权利要求11所述的计算设备,其特征在于,所述常数包括0,而n为2。13.根据权利要求9所述的计算设备,其特征在于,所述重组条件包括“n个字节小于阀值”,当所述原始数据中的一部份数据小于所述阀值时,所述主机将所述检查结果中的对应位设为第一逻辑态,其中所述部份数据的数据长度为n个字节;以及当所述部份数据不小于所述阀值时,所述主机将所述检查结果中的所述对应位设为第二逻辑态。14.根据权利要求13所述的计算设备,其特征在于,所述阀值包括0x03,而n为1。15.根据权利要求9所述的计算设备,其特征在于,当所述检查结果表示所述原始数据中的部份数据符合所述重组条件时,所述主机舍弃所述部份数据;以及当所述检查结果表示所述部份数据不符合所述重组条件时,所述主机将所述部份数据保留于所述经重组数据中。16.一种主机,其特征在于,所述主机包括:内存;以及处理器,以原表地址从所述内存的原始查找表取出原始数据,其中所述处理器以重组条件检查所述原始数据而获得检查结果,所述处理器依照所述检查结果将所述原始数据转换为经重组数据,所述处理器以经压缩表地址将所述经重组数据写入经压缩查找表,所述处理器将所述原表地址、所述经压缩表地址以及所述检查结果之间的关系写入映射表,所述处理器将所述映射表存放于所述内存,以及所述处理器将所述经压缩查找表与所述重组条件提供给装置。17.根据权利要求16所述的主机,其特征在于,在完成所述经压缩查找表与所述映射表的建立后,所述主机清除在所述内存中的所述原始查找表。18.根据权利要求16所述的主机,其特征在于,所述重组条件包括“n个字节为常数”,当所述原始数据中的部份数据全为所述常数时,所述处理器将所述检查结果中的对应位设为第一逻辑态,其中所述部份数据的数据长度为n个字节;以及当所述部份数据不全为所述常数时,所述处理器将所述检查结果中的所述对应位设为第二逻辑态。19.根据权利要求18所述的主机,其特征在于,所述常数包括0,而n为2。20.根据权利要求16所述的主机,其特征在于,所述重组条件包括“n个字节小于阀值”,当所述原始数据中的一部份数据小于所述阀值时,所述处理器将所述检查结果中的对应位设为第一逻辑态,其中所述部份数据的数据长度为n个字节;以及
当所述部份数据不小于所述阀值时,所述处理器将所述检查...
【专利技术属性】
技术研发人员:骆子仁,郭皇志,
申请(专利权)人:创鑫智慧股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。