用于存储系统的实现人工智能的搜索技术方案

技术编号:23315260 阅读:17 留言:0更新日期:2020-02-11 17:51
本公开描述了用于存储系统的实现人工智能的搜索的装置和方法。在一些方面中,存储系统的元数据管理器接收AI引擎在被存储在存储系统中的数据中检测的对象的标签。元数据管理器在元数据数据库的关系部分中创建用于所检测对象的条目,所检测对象的条目具有所检测对象的标签的标识符,以及与所检测对象对应的节点的地址。元数据管理器还在元数据数据库的导航部分中并且利用所检测对象的地址来创建节点,该节点包括对另一对象的相对节点的引用,以及节点与相对节点之间的关系的权重。通过这样做,元数据数据库可以基于各个节点之间的加权关系而被搜索,从而实现对所述存储系统中的数据进行上下文搜索或者隐式搜索。

Search of artificial intelligence for storage system

【技术实现步骤摘要】
用于存储系统的实现人工智能的搜索相关申请的交叉引用本公开要求2018年7月31日提交的美国临时专利申请号62/712,828的优先权,其公开内容通过引用而被整体并入本文。
技术介绍
企业和机构通常实现企业级数据系统来采集并且容纳从进行中的操作、研究、数据挖掘或者其它数据源生成的大量数据。为了适应从这些源采集到的数据的不断增加的体积、种类和速度,利用不断增加的存储容量来构建企业级数据系统以容纳不尽的传入数据流。然而,传入数据的源通常是受控制的源和不受控制的源的组合。这导致大多数数据系统存储大数据(包括结构化数据、非结构化数据和半结构化数据)的复杂混合。尽管数据系统管理员通常能够利用更大容量的大数据来缩放存储容量,但是随着非结构化数据量增加,针对大数据内的特定数据项进行分析或者搜索通常变得更加困难或者低效。具体地,大数据通常包括不符合典型的搜索算法所利用的标准的命名惯例、格式化惯例或者描述惯例的大量非结构化数据或者原始数据。例如,典型的搜索算法可以将搜索的关键字与文件名和文件内的文本相比较以用于与关键字明确地或者确切地匹配。因此,针对包括严格的匹配算法所错过的相关非结构化数据项的大数据中的大量数据,这种类型的搜索可能无法返回结果。这样,使用典型的匹配算法可能是低效的和不准确的,因为这些类型的搜索算法经常错过相关数据,特别是在非结构化数据或者半结构化数据中。
技术实现思路
提供本
技术实现思路
来介绍在具体实施方式和附图中进一步描述的主题。相应地,本
技术实现思路
不应该被认为描述了本质特征,或者被用于限制所要求保护的主题的范围。在一些方面中,存储系统的元数据管理器实现一种方法,该方法接收来自人工智能(AI)引擎的、针对在被存储在存储系统的存储介质中的数据中的所检测对象的标签。元数据管理器在存储系统的元数据数据库的关系部分中创建用于所检测对象的条目。关系部分中的条目包括标签的标识符、以及元数据数据库的导航部分中的与所检测对象相对应的节点的地址。元数据管理器还利用地址来在元数据数据库的导航部分中创建与所检测对象对应的节点。该节点包括对导航部分中的与数据中的另一对象相对应的相对节点的至少一次引用,以及节点与相对节点之间的关系的权重,该所检测对象与该另一对象是相关的。通过这样做,可以基于这些节点以及其它节点的加权关系来对元数据数据库进行搜索,这可以实现对被存储到存储系统的数据进行上下文搜索或者隐式搜索。在其它方面中,一种装置包括:接口,用以从主机接收数据;存储介质,被配置为存储从主机接收到的数据;控制器,被配置为实现对被存储在存储介质上的数据的访问;以及元数据管理器,该元数据管理器与AI引擎相关联。元数据管理器可以被实现为:接收来自AI引擎的、针对由AI引擎在被存储到装置的存储介质的数据中检测到的对象的标签。元数据管理器然后在装置的元数据数据库的关系数据库中为检测到的对象创建条目。关系数据库中的条目包括:标签的标识符,以及元数据数据库的导航数据库中与检测到的对象对应的节点的地址。元数据管理器还在元数据数据库的导航数据库中的地址处创建与所检测对象相对应的节点。该节点包括对导航数据库中的与数据中的另一对象相对应的相对节点的至少一次引用,以及节点与导航数据库中的相对节点之间的关系的权重,所检测对象与该另一对象在上下文上是相关的。在再一些方面中,描述了片上系统(SoC),该片上系统(SoC)包括:到存储系统的存储介质的接口;到主机的接口,从该接口接收数据以用于写入到存储介质;基于硬件的处理器,以及存储器,该存储器存储处理器可执行指令,响应于基于硬件的处理器的执行,该处理器可执行指令实现元数据管理器。该元数据管理器接收来自AI引擎的、针对由AI引擎在被写入到存储介质的数据中检测的对象的标签。元数据管理器然后在元数据数据库的关系数据库中创建用于所检测对象条目。用于所检测对象的条目包括标签的标识符,以及元数据数据库的导航数据库中的与所检测对象相对应的节点的地址。元数据管理器还在元数据数据库的导航数据库中利用该地址来创建与所检测对象相对应的节点。导航数据库中的节点包括对导航数据库中的与数据中的另一对象相对应的相对节点的至少一次引用,以及节点与导航数据库中的相对节点之间的关系的权重,所检测对象与该另一对象在上下文上是相关的。在附图和以下描述中阐述了一个或者多个实施方式的细节。其它特征和优点将通过本说明书和附图以及权利要求书是显见的。附图说明在附图和下面的具体实施方式中阐述了具有实现AI(AI-enabled)的搜索的存储系统的一个或者多个实现的细节。在附图中,附图标记的最左边的数字表示附图标记首次出现的附图。在本说明书中的不同实例以及附图中使用相同的附图标记表示相同的元件:图1图示了具有其中根据一个或多个方面来实现存储系统的设备的示例操作环境。图2图示了在图1中示出的存储系统的人工智能(AI)引擎和元数据管理器的示例配置。图3图示了根据一个或多个方面的关系数据库中的表的示例相应配置。图4图示了根据一个或多个方面的导航数据库的加权图的示例配置。图5描绘了根据一个或多个方面的用于在存储系统中实现对数据的实现AI的搜索的示例方法。图6描绘了用于使用由AI引擎提供的标签来创建用于存储系统的元数据数据库的关系数据库和元数据数据库的示例方法。图7描绘了用于基于通过AI引擎处理存储系统中的数据而提供的标签的集合来构造或者更新元数据数据库的加权图的示例方法。图8描绘了使用关系数据库和导航数据库来对存储系统进行搜索的示例方法。图9图示了用于实现用于存储系统的实现AI搜索的方面的示例片上系统(SoC)环境。图10图示了被配置为实现控制器与其相关联的存储系统中的实现AI的搜索的方面的示例存储系统控制器。具体实施方式用于通过数据进行搜索的传统技术通常依赖于找到针对所存储数据的名称和文本中的搜索项的确切匹配。通常,数据以离散文件的形式被存储到各种类型的电子存储设备中,其格式和大小根据产生数据的应用而不同。大多数操作系统支持通过关键字来对数据文件进行语义搜索,从而搜索算法基于数据中的名称或者文本来查看数据文件。具体地,语义搜索算法可以遍历文件列表、打开每个文件、读取文本内容以用于与关键字相比较、关闭文件、以及报告文件名或者文本内容与关键字的任何匹配。由于其中关键字可以具有相同含义但是在语义上不同的数据的二元性质,这种类型的搜索通常是受限的。此外,在大数据存储的情况下(诸如,在基于云的应用或者企业级应用中),大数据可能包括不符合这些传统的搜索算法所利用的标准的命名惯例、格式化惯例或者描述惯例的大量非结构化数据或者原始数据。因此,针对包括由于缺乏语义匹配的文本而被搜索算法错过的相关非结构化数据项的大数据,严格的语义搜索可能无法返回准确的结果。这样,使用传统的搜索算法(特别是对于大数据)通常是低效的或者不准确的,因为这些搜索算法可能由于缺乏精确的或者显式的语义匹配而错过相关数据。本公开描述了用于存储系统的实现AI的搜索的装置和技术。本文档来自技高网...

【技术保护点】
1.一种用于存储系统的实现人工智能(AI)的搜索的方法,包括:/n从人工智能引擎接收标签,所述标签用于所述存储系统的存储介质中存储的数据中的所检测对象;/n在所述存储系统的元数据数据库的关系部分中创建用于所述所检测对象的条目,所述条目包括:用于所述所检测对象的所述标签的标识符、所述存储系统中用于所述所检测对象的地址、以及所述元数据数据库的导航部分中的与所述所检测对象相对应的节点的地址;以及/n在所述存储系统的所述元数据数据库的所述导航部分中,并且利用用于所述所检测对象的所述地址,来创建与所述所检测对象相对应的所述节点,所述节点包括对所述导航部分中的与所述数据中的另一对象相对应的相对节点的至少一个引用、以及在所述元数据数据库的所述导航部分中的所述节点与所述相对节点之间的关系的权重,所述所检测对象与所述另一对象是相关的。/n

【技术特征摘要】
20180731 US 62/712,828;20190722 US 16/518,5641.一种用于存储系统的实现人工智能(AI)的搜索的方法,包括:
从人工智能引擎接收标签,所述标签用于所述存储系统的存储介质中存储的数据中的所检测对象;
在所述存储系统的元数据数据库的关系部分中创建用于所述所检测对象的条目,所述条目包括:用于所述所检测对象的所述标签的标识符、所述存储系统中用于所述所检测对象的地址、以及所述元数据数据库的导航部分中的与所述所检测对象相对应的节点的地址;以及
在所述存储系统的所述元数据数据库的所述导航部分中,并且利用用于所述所检测对象的所述地址,来创建与所述所检测对象相对应的所述节点,所述节点包括对所述导航部分中的与所述数据中的另一对象相对应的相对节点的至少一个引用、以及在所述元数据数据库的所述导航部分中的所述节点与所述相对节点之间的关系的权重,所述所检测对象与所述另一对象是相关的。


2.根据权利要求1所述的方法,进一步包括:向搜索界面显露所述存储系统的所述元数据数据库,以实现基于所述节点与所述相对节点之间的所述关系的所述权重来至少针对所述所检测对象或所述另一对象的、对所述元数据数据库的搜索。


3.根据权利要求2所述的方法,其中实现基于所述节点与所述相对节点之间的所述关系的所述权重来至少针对所述所检测对象或所述另一对象的、对所述元数据数据库的搜索,对实现对所述存储系统所存储的所述数据的上下文搜索或者隐式搜索是有效的。


4.根据权利要求1所述的方法,进一步包括:
在所述人工智能引擎处接收将被存储在所述存储系统中的所述数据;
利用所述人工智能引擎来处理将被存储的所述数据以检测所述数据中的多个对象,所述多个对象包括所述所检测对象和其他对象;以及
为所述数据中的所述多个所检测对象提供相应标签的集合,所述相应标签的集合包括用于所述所检测对象的所述标签和用于所述另一对象的标签。


5.根据权利要求1所述的方法,进一步包括:
从所述人工智能引擎接收置信级别的指示,所述置信级别用于所述数据中的所述所检测对象与所述另一对象之间的上下文关系;以及
基于所述数据中的所述对象与所述另一对象之间的所述上下文关系的所述置信级别,来定义所述节点与所述相对节点之间的所述关系的所述权重。


6.根据权利要求5所述的方法,其中所述元数据数据库的所述导航部分包括与在所述数据中检测的相应对象相对应的链接节点的加权图,以及
所述方法进一步包括:利用加权链路将所述节点连接到所述相对节点,所述加权链路具有权重,所述权重指示所述节点与所述相对节点之间的所述关系的所定义的所述权重。


7.根据权利要求5所述的方法,其中所述指示是基于由所述人工智能引擎执行的第一人工智能模型而提供的第一置信级别的第一指示,并且所述方法进一步包括:
从所述人工智能引擎,并且基于由所述人工智能引擎执行的第二人工智能模型,接收第二置信级别的第二指示,所述第二置信级别用于所述数据中的所述所检测对象与所述另一对象之间的所述上下文关系;以及
基于所述数据中的所述所检测对象与所述另一对象之间的所述上下文关系的所述第二置信级别,来重新定义所述节点与所述相对节点之间的所述关系的所述权重;或者
基于所述数据中的所述所检测对象与所述另一对象之间的所述上下文关系的所述第二置信级别,来使所述节点从所述相对节点断开链接。


8.根据权利要求1所述的方法,进一步包括:
从所述人工智能引擎并且利用用于所述所检测对象的所述标签,接收所述人工智能引擎在检测所述数据中的所述对象时的置信级别的指示;以及
将所述人工智能引擎的所述置信级别添加到所述元数据数据库的所述关系部分中的用于所述所检测对象的所述条目。


9.根据权利要求1所述的方法,其中:
所述存储系统包括以下中的至少一个:固态驱动器(SSD)、硬盘驱动器(HDD)、或者存储介质驱动器的聚合阵列;以及
所述方法由以下来实现:所述SSD的存储控制器、所述HDD的存储控制器、或者为存储介质驱动器的所述聚合阵列提供主机接口的控制器。


10.一种装置,包括:
接口,用以从主机接收数据;
存储介质,被配置为存储从所述主机接收到的所述数据;
控制器,被配置为实现对所述存储介质上存储的所述数据的访问;以及
元数据管理器,被配置为:
从与所述装置相关联的人工智能引擎接收标签,所述标签用于由所述人工智能引擎在所述装置的所述存储介质中存储的所述数据中检测到的对象;
在...

【专利技术属性】
技术研发人员:K·库德里亚夫瑟夫M·奥伯格N·瓦尼卡
申请(专利权)人:马维尔国际贸易有限公司
类型:发明
国别省市:巴巴多斯;BB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1