Methods and devices for multiple instances of repeated values in a vector are disclosed. The first method calculates a previous example of a vector. The second method calculates the last instance of the vector. It is proposed that these methods be implemented as SIMD instructions. The sequence and parallel CAM implementations are also disclosed. The proposed method can be used to modify the conflict index in the vector memory index operation. In addition, the application of the algorithm to the quantization of quantization is proposed.
【技术实现步骤摘要】
【国外来华专利技术】发现向量内的重复值的多个实例的方法和装置及到排序的应用本公开涉及计算机科学,并且更具体地涉及用于发现向量内的重复值的多个实例的方法和装置及其在排序算法中的应用。
技术介绍
单指令多数据(SIMD)是一类并行计算机。SIMD描述了具有同时对多个数据点执行相同操作的多个处理元件的计算机。因此,这种机器利用数据级并行(DLP)。即,存在同时(并行)计算,但在给定时刻仅存在单个控制进程(指令)。SIMD指令用于SIMD和向量架构中(参见Flynn,“SomeComputerOrganizationsandTheirEffectiveness,IEEETransactionsOnComputers,Vol.c-21,No.9,1972年9月)。SIMD指令集提供加速DLP的高效方式。为SIMD指令提供支持的具体方式是借助向量处理系统(即,使用向量架构的计算机系统)。该专利可交换地使用术语“向量”和“SIMD”。向量处理系统是被配置为利用单个指令处理多个值的系统。向量处理系统可以包括多个向量或向量寄存器,每个向量或向量寄存器具有多个元素,元素具有被分配给每个元素的唯一索引。索引可以 ...
【技术保护点】
在处理属于数据集的多个值的向量处理系统中,所述向量处理系统至少包括具有多个元素的输入向量,所述元素具有被分配给每个元素的唯一索引,所述索引按升序来分配,所述升序对应于所述元素在所述输入向量中的位置,一种用于发现所述输入向量内的重复值的多个实例的方法,所述方法包括以下步骤:将所述值加载到所述输入向量;选择所述输入向量的每个元素;将每个所选元素与所述输入向量的具有比所选元素的索引低的索引的所有元素进行比较,以计算针对所选元素的匹配的数量,其中,所述匹配的数量是具有与所选元素相同值的元素的数量;生成具有与所述输入向量相同数量的元素和相同索引的第一输出向量,其中,所述输入向量的每个 ...
【技术特征摘要】
【国外来华专利技术】1.在处理属于数据集的多个值的向量处理系统中,所述向量处理系统至少包括具有多个元素的输入向量,所述元素具有被分配给每个元素的唯一索引,所述索引按升序来分配,所述升序对应于所述元素在所述输入向量中的位置,一种用于发现所述输入向量内的重复值的多个实例的方法,所述方法包括以下步骤:将所述值加载到所述输入向量;选择所述输入向量的每个元素;将每个所选元素与所述输入向量的具有比所选元素的索引低的索引的所有元素进行比较,以计算针对所选元素的匹配的数量,其中,所述匹配的数量是具有与所选元素相同值的元素的数量;生成具有与所述输入向量相同数量的元素和相同索引的第一输出向量,其中,所述输入向量的每个元素对应于所述第一输出向量的具有相同索引的元素,其中,所述第一输出向量的每个元素具有等于针对所述输入向量的对应元素计算的所述匹配的数量的值。2.根据权利要求1所述的方法,所述方法还包括以下步骤:将所述第一输出向量的所述元素的所述值设置为等于零;针对所述输入向量的每个所选元素:针对所述输入向量中的具有比所选元素的索引低的索引的每个元素:将所选元素的所述值与所述输入向量中的具有比所选元素的索引低的索引的所述元素的所述值进行比较,以识别匹配,其中,生成第一输出向量包括:当所述比较识别出匹配时,将所述第一输出向量的对应于所选元素的元素的值增加一。3.根据权利要求1或2所述的方法,所述方法还包括以下步骤:将所述输入向量的所述元素的所述值相互比较,以识别相等值;生成具有与所述输入向量相同数量的元素和相同索引的第二输出向量,其中,所述输入向量的每个元素对应于所述第二输出向量的具有相同索引的元素,其中,所述第二输出向量的每个元素的值被设置为等于第一值,除非所述输入向量的对应元素的值等于所述输入向量的具有比所述对应元素的索引高的索引的元素的值,由此所述第二输出向量的所述元素的所述值被设置为等于第二值。4.根据权利要求3所述的方法,其中,所述第二输出向量是向量掩码。5.根据权利要求1至4中任一项所述的方法,所述方法还包括以下步骤:提供具有等于所述输入向量的所述元素的数量的多个条目的内容可寻址存储器CAM,每个条目至少包括key字段、count字段以及valid字段,其中,条目在其valid字段被设置为等于第三值时是有效的,并且在其有valid段被设置为等于第四值时是无效的;将所有条目的所述valid字段设置为等于所述第四值;按索引升序选择所述输入向量的每个元素,其中,将每个所选元素与所述输入向量中的具有比所选元素的所述索引低的索引的所有元素进行比较包括:将所选元素的所述值与所有有效条目的所述key字段进行比较,以识别具有等于所选元素的所述值的key字段的匹配条目或另外生成新有效条目,其中,当识别出匹配条目时,则:将所述第一输出向量的对应于所选元素的元素的值设置为等于所述匹配条目的所述count字段,并且然后将所述匹配条目的所述count字段增加一;当生成新有效条目时,则:选择无效条目;将所选条目的所述valid字段设置为所述第三值;将所选条目的所述key字段设置为等于所选元素的所述值;将所述输出向量的对应于所选元素的元素的值设置为等于零;并且然后将所选条目的所述count字段设置为一。6.根据权利要求5所述的方法,其中,每个条目还包括lastindex字段,其中,所述lastindex字段在每次识别出匹配条目或每次生成新有效条目时被更新,其中,已更新的最后索引字段被设置为等于所选元素的所述索引。7.根据权利要求6所述的方法,其中,在针对所有元素更新所述lastindex字段之后,所述方法还包括以下步骤:生成所述第二输出向量,其中,所述第二输出向量的具有与有效条目的所述lastindex字段相等的索引的每个元素的所述值被设置为等于所述第一值,否则所述值被设置为等于所述第二值。8.根据权利要求5至7中任一项所述的方法,其中,并行选择并处理所述输入向量的多个元素。9.根据权利要求8所述的方法,所述方法...
【专利技术属性】
技术研发人员:T·海耶斯,O·帕罗马尔·佩雷斯,O·恩绍尔,A·克里斯特尔·科斯特尔曼,M·巴莱罗·科尔特斯,
申请(专利权)人:巴塞罗纳超级计算机中心国家超级计算机中心,
类型:发明
国别省市:西班牙,ES
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。