System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于语义元数据的二次模糊搜索方法技术_技高网

一种基于语义元数据的二次模糊搜索方法技术

技术编号:40314928 阅读:8 留言:0更新日期:2024-02-07 20:56
本发明专利技术公开了一种基于语义元数据的二次模糊搜索方法,元数据的接入,根据业务需求,接入数据的元数据信息;元数据的标注,针对接入的来自不同业务数据源的元数据,打上不同的业务标签;语义模型的定义,针对不同的业务场景,定义与设置元数据标签关联模式与展示模式;元数据的二次搜索,对接入的元数据生成搜索索引进行二次模糊搜索;元数据搜索结果组织,按照语义模型定义的关联进行元数据搜索结果的汇总与关联组织的功能;元数据搜索交互,接收用户的请求输入与可视化呈现元数据的搜索结果。本发明专利技术发现全、易理解,增加了元数据搜索的全面性与元数据搜索结果的可理解性,提高了数据的搜索发现能力。

【技术实现步骤摘要】

本专利技术涉及元数据搜索,尤其涉及一种基于语义元数据的发现全、易理解的二次模糊搜索方法。


技术介绍

1、随着信息技术的发展,业务系统的数量不断增加,各业务系统的数据存储形式各异,导致不同业务系统对同一主题分类的数据分散存储,从而对主题数据的发现难度大。元数据是描述数据的数据,通过对元数据的搜索来发现与定位相应的主题数据成为目前常用的方法,目前元数据的搜索方法,通过对关键词的匹配的模式来搜索发现在特定数据库元数据,该类搜索方式难以将同一类主题分类的数据发现全,并且搜索发现的元数据以独立的方式展示,不利用理解与应用。


技术实现思路

1、专利技术目的:本专利技术的目的是提供一种基于语义元数据的二次模糊搜索方法,用以实现对分散的元数据进行统一的搜索、组织与展示,达到对同一类主题分类的元数据搜索发现全、易理解的效果。

2、技术方案:本专利技术包括如下步骤:

3、(1)元数据的接入,根据业务需求,通过在web页面输入数据源参数,配置待搜索的数据源信息,选择接入的数据范围,接入数据的元数据信息;

4、(2)元数据的标注,针对接入的来自不同业务数据源的元数据,通过元数据标注打上不同的业务标签;

5、(3)语义模型的定义,针对不同的业务场景,定义与设置关联的元数据标签关联模式与展示模式;

6、(4)元数据的二次搜索,对接入的元数据生成搜索索引,并基于语义模型对元数据以及关联的元数据进行二次模糊搜索;

7、(5)元数据搜索结果组织,按照语义模型定义的关联进行元数据搜索结果的汇总与关联组织的功能;

8、(6)元数据搜索交互,接收用户的请求输入与可视化呈现元数据的搜索结果。

9、进一步地,所述步骤(1)中数据源包括结构化数据源、半结构化数据源以及非结构化数据源。

10、进一步地,所述步骤(1)中元数据的接入模块包括数据库接入单元和文件数据接入单元。

11、进一步地,所述数据库接入单元支持结构化数据、半结构化数据的元数据接入,配置数据的连接信息,选择接入的数据库表的范围,采集数据表与字段的信息。

12、进一步地,所述文件接入单元支持对文件的类型、标题、存储位置元数据信息的采集。

13、进一步地,所述步骤(2)针对接入的元数据提供自动标注与手动标注的功能。

14、进一步地,所述步骤(3)语义模型的定义包括元数据标签的集合、元数据标签与标签间的关联模式以及标签的表示模式。

15、进一步地,所述步骤(4)提供对接入的元数据自动生成搜索索引,并支持元数据的关键词的模糊匹配,当匹配到对应的元数据后,利用该元数据对应标签关联的语义模型,得到关联的标签,即关联的元数据的信息,再从关联的元数据二次搜索得到对应元数据项。

16、进一步地,所述步骤(5)针对元数据二次搜索的结果,基于语义模型中定义的元数据标签的关联模式,对搜索结果进行关联。

17、进一步地,所述步骤(6)元数据搜索交互包括提供接收用户的请求输入,以及基于语义模型中定义的结果表示模式,对搜索结果进行图、文、表形式的可视化呈现。

18、有益效果:本专利技术与现有技术相比,具有如下显著优点:增加了元数据搜索的全面性与元数据搜索结果的可理解性,本申请只需要在web页面中定义配置元数据的语义模型,即可搜索到分散在各类异构存储中的元数据信息,并且以定义的组织模式将搜索的元数据结果以图、文、表的形式展现出来,提高了数据的搜索发现能力。

本文档来自技高网...

【技术保护点】

1.一种基于语义元数据的二次模糊搜索方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(1)中数据源包括结构化数据源、半结构化数据源以及非结构化数据源。

3.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(1)中元数据的接入模块包括数据库接入单元和文件数据接入单元。

4.根据权利要求3所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述数据库接入单元支持结构化数据、半结构化数据的元数据接入,配置数据的连接信息,选择接入的数据库表的范围,采集数据表与字段的信息。

5.根据权利要求3所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述文件接入单元支持对文件的类型、标题、存储位置元数据信息的采集。

6.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(2)针对接入的元数据提供自动标注与手动标注的功能。

7.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(3)语义模型的定义包括元数据标签的集合、元数据标签与标签间的关联模式以及标签的表示模式。

8.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(4)提供对接入的元数据自动生成搜索索引,并支持元数据的关键词的模糊匹配,当匹配到对应的元数据后,利用该元数据对应标签关联的语义模型,得到关联的标签,即关联的元数据的信息,再从关联的元数据二次搜索得到对应元数据项。

9.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(5)针对元数据二次搜索的结果,基于语义模型中定义的元数据标签的关联模式,对搜索结果进行关联。

10.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(6)元数据搜索交互包括提供接收用户的请求输入,以及基于语义模型中定义的结果表示模式,对搜索结果进行图、文、表形式的可视化呈现。

...

【技术特征摘要】

1.一种基于语义元数据的二次模糊搜索方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(1)中数据源包括结构化数据源、半结构化数据源以及非结构化数据源。

3.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(1)中元数据的接入模块包括数据库接入单元和文件数据接入单元。

4.根据权利要求3所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述数据库接入单元支持结构化数据、半结构化数据的元数据接入,配置数据的连接信息,选择接入的数据库表的范围,采集数据表与字段的信息。

5.根据权利要求3所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述文件接入单元支持对文件的类型、标题、存储位置元数据信息的采集。

6.根据权利要求1所述的基于语义元数据的二次模糊搜索方法,其特征在于,所述步骤(2)针对接入的元数据提供自动标注与手动标注的功能。

【专利技术属性】
技术研发人员:戚可生周中元严红陆保国蒋锴郑少秋苏晓威后弘毅
申请(专利权)人:中国电子科技集团公司第二十八研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1