高性能散列系统技术方案

技术编号：2921314 阅读：166 留言：0更新日期：2012-04-11 18:40

公开了一种使用散列函数的高性能、低延迟的数据检索系统。给定一组输入数据，数据检索系统可根据预定的散列函数生成一个或多个索引值和一个签名值。索引值可被应用到各个数据阵列以访问其中的数据单元。在填充阵列时数据单元可包括先前开发的签名。如果来自数据单元的签名与从散列函数生成的签名匹配，那么相关的索引可被应用于各个数据阵列的第二部分以检索请求的数据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的实施例涉及使用散列函数的存储器查找操作，尤其涉及为大规模存储器设计的此类操作。
技术介绍
“散列”通常描述一种用于在存储系统中查找数据的技术。给定一组输入数据，散列函数生成索引值。当散列值被应用于存储器时，索引值应当使得所请求的数据从其上读取。不幸的是，根据使用的散列函数，索引值不能唯一地识别请求的数据。散列函数有可能可以为两个或更多的唯一输入值生成相同的索引值。这叫做“冲突”。为了防止冲突的可能性，索引值通常用作指向数据链表的指针。链表中的每个元素通常包含正在寻找的数据(这里称为“有效负载”数据)，与它相关的输入数据的副本，和指向链表中下一个元素的指针。在这样的系统中，必须连续地检查链表中每个元素，直到输入数据的副本确定已经找到响应数据或者直到链表穷尽。在上面描述的那些系统，连续检查链表中的每个元素浪费了时间。对于高性能应用或者那些所涉及的大型数据集(几百万条或更多的存储条目)尤其不利。例如，考虑查找一个已建立的连接表的过程以支持著名的传输控制协议(TCP)。给定一个包括IP源地址、IP目的地址、TCP源端口和TCP目的端口的输入元组，该过程需要查找存储器以检索代表连接状态的数据。使用传统的链表实现，当有效连接的数量增加时，冲突率和链表的长度也增加。假设，如果检索命中带有六个条目的链表，系统必须读取每个条目以便检测匹配。因为表中的每个条目包括指向列表下一个条目的指针，不同的条目不能并行读取。在确定输入数据是命中还是未命中存储器之前要求多达六个的连续存储器的读取。于是，此类实现的延迟问题会很严重。在一个著名的TCP实现中，IP源和目的地址的...

【技术保护点】
装置，包括：散列值生成器，具有索引值和签名值的输出，第一存储阵列，具有与索引值输出耦合的输入，比较器，具有与签名值和来自第一阵列的输出耦合的输入，第二存储阵列，具有与索引值输出以及比较器的输出耦合的输入。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：JH克吕格尔，WK费格哈利，G沃尔里希，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人