【技术实现步骤摘要】
码处理技术
本技术涉及编码技术。
技术介绍
在常规技术中,为了压缩输入字符串而生成短语树。短语树中的每个节点包括待被字符或字符串代替的码、待压缩的字符、表示层级的数据、指向父节点的指针、指向与可以被使用的每个字符对应的子节点中的每个子节点的指针、以及对与子节点中的每个子节点对应的字符出现的次数进行计数的计数器。例如,当输入字符串“ABABCABCABCCBCBCBCAAACBACBACBBCCBB”被输入时,生成例如如图1所示的短语树。为了生成新节点的出现次数的阈值是“2”。在此示例中,根节点被设置成第0级节点,而字符“0x00”至“0xFF”的节点被设置成第1级节点。作为第2级节,字符“0x42”和“0x41”的节点被设置成字符“0x41”的子节点,字符“0x43”的节点被设置成字符“0x42”的子节点,字符“0x42”的节点被设置成字符“0x43”的子节点。而且,作为第3级节点,字符“0x43”的节点被设置成字符“0x42”的子节点,并且字符“0x43”、“0x41”、“0x42”的节点被设置成字符“0x42”的子节点。针对每个节点,示意地示出了码(A)、字符(B)、子节点的字符的出现次数(C)和指向子节点的指针(D)。如图2所示,因为子节点指针的数量和用于子节点的字符的出现次数的计数器的数量等于256,256等于可以使用的字符的数量,所以3,085个字节被用作针对一个节点所使用的存储器容量。假设提供了作为可以用2个字节的码长度表示的最大数量节点的65536个节点,则总共大约192M字节被用作存储器容量。当用于代替字符串的码的类型的数量(换言之,节点的 ...
【技术保护点】
一种信息处理方法,包括:针对将要使用的每个字符,第一生成数据块,所述数据块包括:第一区域,所述第一区域用于保存字符或字符串的码;第二区域,所述第二区域用于针对将要使用的每个字符,保存接着所述字符或所述字符串下一个出现的第二字符的出现序号;以及第三区域,所述第三区域用于根据所述出现序号来保存出现次数,或者当所述出现次数超过阈值时,保存与包括所述字符或所述字符串和所述第二字符的字符串对应的码;当检测到:在输入字符串中包括的多个字符中的正在被处理的字符或字符串的数据块的第二区域中,保存了接着所述输入字符串中的所述正在被处理的字符或字符串的下一个字符的出现序号;在所述数据块的第三区域中,所述出现次数被保存成所述出现序号中的数据;以及增加之后的所述出现次数超过所述阈值时,存储与包括所述正在被处理的字符或字符串和所述下一个字符的第二字符串对应的码;以及生成所述第二字符串的数据块,所述第二字符串的所述数据块具有与在所述第一生成中所生成的所述数据块相同的结构。
【技术特征摘要】
2012.06.28 JP 2012-1452241.一种信息处理方法,包括:针对多个字符中的每个字符,通过第一生成来生成数据块,所述数据块包括:第一区域,所述第一区域用于保存特定字符或特定字符串的码;第二区域,所述第二区域用于针对所述多个字符中的每个字符,保存在输入字符串中接着所述特定字符或所述特定字符串下一个出现的第二字符的出现序号;以及第三区域,所述第三区域用于在所述第二字符的出现次数没有超过特定阈值的情况下,按照所述第二字符的出现序号的顺序来保存所述第二字符的出现次数,或者在所述出现次数超过所述特定阈值的情况下,保存针对包括所述特定字符或所述特定字符串和所述第二字符的某一字符串生成的码;当检测到:在所述输入字符串中正在被处理的字符或字符串的数据块的第二区域中,保存了在所述输入字符串中接着所述正在被处理的字符或字符串下一个出现的下一个字符的出现序号;在所述正在被处理的字符或字符串的数据块的第三区域中,所述出现次数被保存成所述出现序号中的数据;以及增加之后的所述出现次数超过所述特定阈值时,存储针对包括所述正在被处理的字符或字符串和所述下一个字符的第二字符串生成的码;以及生成所述第二字符串的数据块,所述第二字符串的所述数据块具有与在所述第一生成中所生成的所述数据块相同的结构。2.根据权利要求1所述的信息处理方法,还包括:当检测到:在所述正在被处理的字符或字符串的所述数据块的所述第二区域中,保存了所述下一个字符的所述出现序号;在所述正在被处理的字符或字符串的数据块的所述第三区域中,所述出现次数被保存成所述出现序号中的数据;以及所述增加之后的所述出现次数没有超过所述特定阈值时,将所述下一个字符设置成正在被处理的字符。3.根据权利要求2所述的信息处理方法,还包括:当检测到:在所述正在被处理的字符或字符串的数据块的所述第二区域中,保存了所述下一个字符的所述出现序号;以及在所述正在被处理的字符或字符串的数据块的所述第三区域中,针对所述第二字符串生成的所述码被保存成所述出现序号中的所述数据时,将所述第二字符串设置成正在被处理的字符串。4.根据权利要求1所述的信息处理方法,其中,所述第三区域的区域数量被限制到预定数量,并且所述数据块还包括第四区域,所述第四区域用于保存表示所述第三区域的扩展区域的数据。5.根据权利要求1所述的信息处理方法,还包括:根据针对所述输入字符串所生成的多个数据块来生成关联数据,从而针对由在特定状态中的所述多个数据块所表示的树结构的第二层和后续层中的数据块中的每个数据块,将所述数据块的父数据块的码关联到与针对所述数据块增加的字符对应的字符码,其中,所述特定状态是其中将所述多个数据块的所述第一区域和所述第三区域中所保存的第一码重新分配到基于与所述第一码对应的字符或字符串的顺序确定的第二码的状态。6.根据权利要求5所述的信息处理方法,其中,在所述关联数据中,还关联所述数据块的子数据块的码中的最大码。7.一种信息处理方法,包括:通过第一生成来生成数据块,针对多个字符中每个字符以及接着已经为其生成所述数据块的输入字符串中的字符或字符串出现了预定次数或更多次数的每个字符,所述数据块包括:第一区域,所述第一区域用于保存特定字符或特定字符串的码;第二区域,所述第二区域用于针对所述多个字符中的每个字符,保存在所述输入字符串中接着所述特定字符或所述特定字符串下一个出现的第二字符的出现序号;以及第三区域,所述第三区域用于在所述第二字符的出现次数没有超过特定阈值的情况下,按照所述第二字符的出现序号的顺序来保存所述第二字符的出现次数,或者在所述出现次数超过阈值的情况下,保存针对包括所述特定字符或所述特定字符串和所述第二字符的字符串生成的码;根据针对所述输入字符串所生成的多个数据块通过第二生成来生成:第一关联数据,所述第一关联数据将表示由在特定状态中的所述多个数据块所表示的树结构中的根的数据或者所述树结构中的第一层中的数据块中的每个数据块的子数据块的码中的最大码关联到所述树结构中的第一层中的数据块中的每个数据块的字符码并且关联到所述数据块的层编号;以及第二关联数据,所述第二关联数据针对所述树结构的第二层和后续层中的数据块中的每个数据块,将所述数据块的父数据块的码或者所述数据块的子数据块的码中的最大码关联到与针对所述数据块增...
【专利技术属性】
技术研发人员:二宫大介,樋口真嘉,小山丰,西垣雅树,松村量,小野敏郎,小泽崇记,川井纯史,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。