System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据领域,可以用于金融领域,具体是一种跨领域元数据处理方法及装置。
技术介绍
1、随着大数据业务的不断发展,各行业的数据规模都呈现出指数级的增长,而用以描述数据构成的元数据成为发展大数据业务的关键。在实际业务开展的过程中,经常出现跨领域使用的情况,当单一领域的元数据难以满足用户的使用需求时,需要对不同领域的元数据进行检索,而现有的构建知识图谱的方法难以迅速汇集各领域的数据并提供给用户使用。
技术实现思路
1、针对现有技术中的问题,本申请提供一种跨领域元数据处理方法及装置,能够利用元数据溯源链路迅速构建全领域知识图谱,实现全领域元数据的检索。
2、为解决上述技术问题,本申请提供以下技术方案:
3、第一方面,本申请提供一种跨领域元数据处理方法,包括:
4、根据元数据与所述元数据所属的领域构建对应的分领域知识图谱;
5、利用所述分领域知识图谱与预先分析的元数据溯源链路生成全领域知识图谱;
6、根据预设的元数据检索条件对所述全领域知识图谱进行检索,得到元数据检索结果;其中,所述元数据检索结果包括数据项与数据关系。
7、进一步地,所述根据元数据与所述元数据所属的领域构建对应的分领域知识图谱,包括:
8、根据所述元数据的第一数据信息确定所述分领域知识图谱中的关系;其中,所述第一数据信息包括数据字典及数据规范;
9、根据所述元数据的第二数据信息确定所述分领域知识图谱中的属性;其中,所述第二
10、将所述元数据作为所述分领域知识图谱中的实体,与所述关系及所述属性组成所述分领域知识图谱。
11、进一步地,所述利用所述分领域知识图谱与预先分析的元数据溯源链路生成全领域知识图谱,包括:
12、对所述元数据溯源链路按其中所包含的元数据所属的领域进行切段划分,得到各领域之间有关所述元数据的传输关联关系;
13、根据所述传输关联关系将各分领域知识图谱进行关联,得到初始全领域知识图谱;
14、对所述初始全领域知识图谱中具有歧义的元数据进行同义化处理,得到所述全领域知识图谱。
15、进一步地,预先分析所述元数据溯源链路的步骤,包括:
16、根据所述元数据确定对应的程序代码;
17、根据所述程序代码的上下游调用关系生成所述元数据溯源链路。
18、进一步地,预先分析所述元数据溯源链路的步骤,包括:
19、根据所述元数据确定对应的程序日志;
20、根据所述程序日志中的数据传输记录生成所述元数据溯源链路。
21、进一步地,所述根据预设的元数据检索条件对所述全领域知识图谱进行检索,得到元数据检索结果,包括:
22、根据所述元数据检索条件确定待检索词汇;
23、若所述全领域知识图谱中包括所述待检索词汇,生成并输出对应的数据项与数据关系;
24、若所述全领域知识图谱中不包括所述待检索词汇,确定所述待检索词汇对应的相似词汇;根据所述相似词汇检索所述全领域知识图谱,生成并输出对应的数据项与数据关系。
25、第二方面,本申请提供一种跨领域元数据处理装置,包括:
26、分领域图谱生成单元,用于根据元数据与所述元数据所属的领域构建对应的分领域知识图谱;
27、全领域图谱生成单元,用于利用所述分领域知识图谱与预先分析的元数据溯源链路生成全领域知识图谱;
28、图谱检索单元,用于根据预设的元数据检索条件对所述全领域知识图谱进行检索,得到元数据检索结果;其中,所述元数据检索结果包括数据项与数据关系。
29、进一步地,所述分领域图谱生成单元,包括:
30、关系确定模块,用于根据所述元数据的第一数据信息确定所述分领域知识图谱中的关系;其中,所述第一数据信息包括数据字典及数据规范;
31、属性确定模块,用于根据所述元数据的第二数据信息确定所述分领域知识图谱中的属性;其中,所述第二数据信息包括数据备注;
32、分领域图谱生成模块,用于将所述元数据作为所述分领域知识图谱中的实体,与所述关系及所述属性组成所述分领域知识图谱。
33、进一步地,所述全领域图谱生成单元,包括:
34、传输关联确定模块,用于对所述元数据溯源链路按其中所包含的元数据所属的领域进行切段划分,得到各领域之间有关所述元数据的传输关联关系;
35、初始全领域图谱生成模块,用于根据所述传输关联关系将各分领域知识图谱进行关联,得到初始全领域知识图谱;
36、全领域图谱生成模块,用于对所述初始全领域知识图谱中具有歧义的元数据进行同义化处理,得到所述全领域知识图谱。
37、进一步地,所述全领域图谱生成单元,包括:
38、程序代码确定模块,用于根据所述元数据确定对应的程序代码;
39、第一溯源链路确定模块,用于根据所述程序代码的上下游调用关系生成所述元数据溯源链路。
40、进一步地,所述全领域图谱生成单元,包括:
41、程序日志确定模块,用于根据所述元数据确定对应的程序日志;
42、第二溯源链路确定模块,用于根据所述程序日志中的数据传输记录生成所述元数据溯源链路。
43、进一步地,所述图谱检索单元,包括:
44、检索词汇确定模块,用于根据所述元数据检索条件确定待检索词汇;
45、第一项与关系生成模块,用于若所述全领域知识图谱中包括所述待检索词汇,生成并输出对应的数据项与数据关系;
46、第二项与关系生成模块,用于若所述全领域知识图谱中不包括所述待检索词汇,确定所述待检索词汇对应的相似词汇;根据所述相似词汇检索所述全领域知识图谱,生成并输出对应的数据项与数据关系。
47、第三方面,本申请提供一种电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述跨领域元数据处理方法的步骤。
48、第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述跨领域元数据处理方法的步骤。
49、第五方面,本申请提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述跨领域元数据处理方法的步骤。
50、针对现有技术中的问题,本申请提供的跨领域元数据处理方法及装置,能够对各领域元数据进行溯源分析,找到各领域之间彼此联系沟通的关键元数据,并利用关键元数据作为各领域元数据知识图谱的连接点,形成各领域集成的全领域元数据知识图谱,实现跨领域元数据的关联以及同义元数据的歧义消除,实现跨领域的元数据快速检索与使用。
本文档来自技高网...【技术保护点】
1.一种跨领域元数据处理方法,其特征在于,包括:
2.根据权利要求1所述的跨领域元数据处理方法,其特征在于,所述根据元数据与所述元数据所属的领域构建对应的分领域知识图谱,包括:
3.根据权利要求1所述的跨领域元数据处理方法,其特征在于,所述利用所述分领域知识图谱与预先分析的元数据溯源链路生成全领域知识图谱,包括:
4.根据权利要求1所述的跨领域元数据处理方法,其特征在于,预先分析所述元数据溯源链路的步骤,包括:
5.根据权利要求1所述的跨领域元数据处理方法,其特征在于,预先分析所述元数据溯源链路的步骤,包括:
6.根据权利要求1所述的跨领域元数据处理方法,其特征在于,所述元数据检索结果包括:数据项与数据关系;所述根据预设的元数据检索条件对所述全领域知识图谱进行检索,得到元数据检索结果,包括:
7.根据权利要求1所述的跨领域元数据处理方法,其特征在于,还包括:
8.一种跨领域元数据处理装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述的跨领域元数据处理方法的步骤。
...【技术特征摘要】
1.一种跨领域元数据处理方法,其特征在于,包括:
2.根据权利要求1所述的跨领域元数据处理方法,其特征在于,所述根据元数据与所述元数据所属的领域构建对应的分领域知识图谱,包括:
3.根据权利要求1所述的跨领域元数据处理方法,其特征在于,所述利用所述分领域知识图谱与预先分析的元数据溯源链路生成全领域知识图谱,包括:
4.根据权利要求1所述的跨领域元数据处理方法,其特征在于,预先分析所述元数据溯源链路的步骤,包括:
5.根据权利要求1所述的跨领域元数据处理方法,其特征在于,预先分析所述元数据溯源链路的步骤,包括:
6.根据权利要求1所述的跨领域元数据处理方法,其特征...
【专利技术属性】
技术研发人员:张展,胡屹,李庚,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。