【技术实现步骤摘要】
利用脉冲神经网络管理认知存储系统的数据集
技术介绍
本文中描述的示例实施例总体上涉及用于管理存储系统的数据集的计算机实现的方法和系统的领域,并且更特别地涉及依赖于脉冲神经网络来学习和推断数据集所属于的类的表示以相应地管理整个存储系统的数据集的认知存储系统。在认知存储系统中,文件的相关性有时被用于确定系统的存储策略,以便在保持文件管理的可靠性和性能的同时降低存储成本。数据的相关性(或值)是与数据集(例如,文件)相关联的度量,该度量反映这样的数据集对用户的重要性。文件的相关性例如可以通过从用户获取重要和不重要文件的样本并且应用监督学习算法估计其他文件的相关性度量而被估计。此外,已知多层存储系统,其包括若干存储层。这样的系统通常将不同类的数据分配给各种类型的存储介质,以便在保持性能的同时降低全局存储成本。分层存储系统通常依赖于如下策略:将最常访问的数据分配给高性能存储层,而将很少访问的数据存储在低性能(更便宜和/或更慢)存储层上。考虑例如如下存储系统:其中应用在大批量数据集(例如,天文数据存储库、金融交易日志、医疗数据存储库)上被运行。 ...
【技术保护点】
1.一种用于管理存储系统的数据集的计算机实现的方法,其中所述数据集具有元数据的相应集合,所述方法包括:/n将元数据的第一集合连续地馈送给脉冲神经网络(SNN),馈送的元数据的所述第一集合对应于所述存储系统的如下数据集,所述数据集关于所述数据集所属于的类而被标记,以便与类标签相关联,以用于所述SNN在连接权重的方面学习所述类的表示,所述连接权重对馈送的所述元数据加权;/n将元数据的第二集合连续地馈送给所述SNN,元数据的所述第二集合对应于所述存储系统的未标记的数据集,以用于所述SNN基于馈送的元数据的所述第二集合和学习的所述表示来推断针对所述未标记的数据集的类标签;以及/n基 ...
【技术特征摘要】
20180622 US 16/015,8971.一种用于管理存储系统的数据集的计算机实现的方法,其中所述数据集具有元数据的相应集合,所述方法包括:
将元数据的第一集合连续地馈送给脉冲神经网络(SNN),馈送的元数据的所述第一集合对应于所述存储系统的如下数据集,所述数据集关于所述数据集所属于的类而被标记,以便与类标签相关联,以用于所述SNN在连接权重的方面学习所述类的表示,所述连接权重对馈送的所述元数据加权;
将元数据的第二集合连续地馈送给所述SNN,元数据的所述第二集合对应于所述存储系统的未标记的数据集,以用于所述SNN基于馈送的元数据的所述第二集合和学习的所述表示来推断针对所述未标记的数据集的类标签;以及
基于包括推断的所述类标签的所述数据集的类标签来管理所述存储系统中的数据集。
2.根据权利要求1所述的方法,其中
连续地馈送元数据的所述第一集合包括将所述第一集合中的元数据映射到所述SNN的输入神经元上并且激活映射的所述输入神经元以由此学习所述表示。
3.根据权利要求2所述的方法,其中
连续地馈送元数据的所述第二集合包括在映射的所述元数据中标识与所述第二集合的元数据匹配的元数据并且激活对应的输入神经元以由此推断针对所述未标记的数据集的所述类标签。
4.根据权利要求3所述的方法,其中
所述存储系统的所述数据集的元数据的所述相应集合被捕获为键值对的集合,所述对中的每个对包括表示元数据字段的键和表示所述元数据字段的值的值。
5.根据权利要求4所述的方法,其中:
映射所述第一集合的元数据包括将所述第一集合的键值对映射到所述SNN的相应输入神经元上,由此映射的所述输入神经元中的每个输入神经元对应于所述第一集合的所述键值对中的相应键值对;以及
标识与所述第二集合的元数据匹配的元数据包括在映射的所述键值对中标识与所述第二集合的键值对匹配的键值对,以便激活对应的输入神经元并且由此推断针对所述未标记的数据集的类标签。
6.根据权利要求4所述的方法,其中
所述输入神经元属于所述SNN的第一层,所述SNN还包括被映射到所述类标签上的第二层的输出神经元,其中
所述输出神经元经由多对多横向抑制连接被彼此连接,以及
所述第一层的输入神经元经由多对多兴奋性连接被连接到所述第二层的输出神经元,所述连接权重与所述多对多兴奋性连接相关联。
7.根据权利要求6所述的方法,其中
所述表示针对对应于馈送的键值对的每个集合的每个标记的数据集通过以下至...
【专利技术属性】
技术研发人员:G·舍鲁比尼,T·莫莱蒂斯,A·塞巴斯蒂安,V·文卡特桑,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。