当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于神经网络的索引数据结构及其数据检索方法技术

技术编号:20221667 阅读:51 留言:0更新日期:2019-01-28 20:12
本发明专利技术公开了一种基于神经网络的索引数据结构,包括数据映射单元和动态索引单元;数据映射单元是基于神经网络模型的数据映射单元,采集命名数据网络中的名称数据作为样本,计算其累积分布函数值作为标签,训练得到神经网络模型,用于把名称数据映射到改进型位图bitmap数据结构中的相应位置;动态索引单元是基于改进型位图bitmap数据结构的动态索引单元,将传统位图平均分成若干桶,并将桶内每个槽的大小扩展,得到可动态标号的改进型位图bitmap数据结构,用于存储名称数据所对应的地址偏移量。本发明专利技术针对命名数据网转发平面特点,可以在保证检索速度和误判概率的条件下,提升存储效率,实现快速数据插入及检索操作。

【技术实现步骤摘要】
一种基于神经网络的索引数据结构及其数据检索方法
本专利技术属于高性能路由器索引数据结构设计领域,特别针对命名数据网(NamedDataNetworking)转发平面中索引内容的高效存储和快速检索问题。
技术介绍
超高清视频、人工智能、云计算等创新应用、技术和计算模式的不断涌现,加速了互联网由“通信信道”向“数据处理平台”的角色转变。现有基于设备地址的IP互联网体系结构在信息共享、移动性、安全性、可扩展性等方面存在的弊端已成为阻碍互联网发展的重大难题。因此,一种新型未来互联网架构,命名数据网,于2010年被提出,得到了国内外学术界的广泛关注。命名数据网以数据名称代替IP地址,使用完全面向数据内容的通信模式。其优势在于通过在路由节点中部署缓冲存储器,实现真正意义上的数据内容共享,极大地降低网络负载,有效提高网络数据传输速率。正因此,其被认为是未来互联网架构领域最有前景的发展方向之一。然而,命名数据网也面临着一系列亟待解决的问题与挑战,特别是转发平面中索引内容的高效存储和快速检索问题。其中,索引数据结构是提高转发平面性能的关键,但目前主要研究成果都各有优缺点。例如,基于字典树的数据结构查找本文档来自技高网...

【技术保护点】
1.一种基于神经网络的索引数据结构,其特征在于,包括数据映射单元和动态索引单元;所述数据映射单元是基于神经网络模型的数据映射单元,采集命名数据网络中的名称数据作为样本,计算其累积分布函数值作为标签,根据样本和标签训练反向传播神经网络,得到神经网络模型,用于把要检索的名称数据映射到改进型位图bitmap数据结构中的相应位置;所述动态索引单元是基于改进型位图bitmap数据结构的动态索引单元,将传统位图bitmap数据结构平均分成若干桶,并将桶内每个槽的大小扩展,得到可动态标号的改进型位图bitmap数据结构,记为D‑bitmap,用于存储要检索的名称数据所对应的地址偏移量。

【技术特征摘要】
1.一种基于神经网络的索引数据结构,其特征在于,包括数据映射单元和动态索引单元;所述数据映射单元是基于神经网络模型的数据映射单元,采集命名数据网络中的名称数据作为样本,计算其累积分布函数值作为标签,根据样本和标签训练反向传播神经网络,得到神经网络模型,用于把要检索的名称数据映射到改进型位图bitmap数据结构中的相应位置;所述动态索引单元是基于改进型位图bitmap数据结构的动态索引单元,将传统位图bitmap数据结构平均分成若干桶,并将桶内每个槽的大小扩展,得到可动态标号的改进型位图bitmap数据结构,记为D-bitmap,用于存储要检索的名称数据所对应的地址偏移量。2.一种根据权利要求1所述基于神经网络的索引数据结构的数据检索方法,其特征在于,包括在索引数据结构中插入数据,以及对插入数据之后的索引数据结构进行数据检索;具体步骤如下:步骤一、在所述索引数据结构中插入名称数据,每插入一个名称数据,包括以下步骤:步骤1-1:输入名称数据:将待插入的名称数据输入到上述的索引数据结构中;步骤1-2:数据映射单元的神经网络计算:将该名称数据定长处理后输入上述的神经网络模型运算,得到一个范围在0、1之间的实数值;步骤1-3:数据映射单元的位置映射计算:将神经网络计算结果乘D-bitmap的槽总数,得出该名称数据映射到D-bitmap上的位置,即D-bitmap的槽序号;步骤1-4:动态索引单元的桶序号计算:用槽序号除以每个桶的槽数量,并向下取整,得出该位置所在的桶序号;步骤1-5:动态索引单元的最大标号查找:由步骤1-4得到的桶序号,...

【专利技术属性】
技术研发人员:闫柳李卓刘开华
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1