一种多源异构信息通道耦合方法技术

技术编号:36808220 阅读:36 留言:0更新日期:2023-03-09 00:28
本发明专利技术涉及多源异构信息通道技术领域,具体是一种多源异构信息通道耦合方法,包括构建初始通道耦合知识图谱,基于通道耦合知识图谱实现通道数据耦合和基于通道耦合知识图谱实现数据检索。通道耦合知识图谱的实体是以通道标准数据形式存在,减小知识图谱的占用空间;通道耦合知识图谱在融合过程中以及在检索过程中,采用了剪枝策略进行逐层匹配,加快了检索速度;通道数据耦合是对知识图谱不断拓展的动态过程,增加了数据存储量。增加了数据存储量。增加了数据存储量。

【技术实现步骤摘要】
一种多源异构信息通道耦合方法


[0001]本专利技术涉及多源异构信息通道
,具体是一种多源异构信息通道耦合方法。

技术介绍

[0002]政务数据数量不断增加,政务大数据平台不断建立,由于各平台系统之间分散建设、分散应用和分散管理,平台间存在严重的信息壁垒。而且,各政务业务系统间不同数据格式、不同数据标准、不同数据管辖权造成了数据鸿沟,以及行政资源的浪费与行政效率的低下,无法实现内部纵向或横向协同。为了解决上述问题,有必要将各部门的不同类型的数据汇聚、关联和融合,因此,需要解决多源异构数据之间的融合问题,本专利技术正是为解决该问题而提出。
[0003]要解决多源异构数据融合问题首先得解决数据统一标准问题。由于长期处于无统一标准的管理下,各部门采集的数据格式不一,标准不一,数据处理技术各异,数据库接口不互通,多源异构数据多是简单的检索分析,存在系统不健全,搜索范围小,搜索速度慢等问题,很大程度上限制了政务数据在宏观调控的应用支撑能力,阻断了政务数据的交换与共享。

技术实现思路

[0004]针对现有技术中存在的缺陷,本专本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多源异构信息通道耦合方法,其特征在于,包括构建初始通道耦合知识图谱,基于通道耦合知识图谱实现通道数据耦合和基于通道耦合知识图谱实现数据检索;所述构建初始通道耦合知识图谱,包括:将信息资源目录中规定的“类”、“项”、“目”抽取成实体,形成初始通道耦合知识图谱的框架;再对每一个“目”提取关键词,将关键词抽取为“细目”实体,补充初始通道耦合知识图谱的枝叶;其中,“类”与“项”实体之间是包含关系,“项”和“目”实体之间是包含关系,“目”和“细目”实体之间是关联关系;所述基于通道耦合知识图谱实现通道数据耦合,包括获取通道数据,数据预处理,数据封装和通道数据融合;所述数据预处理包括:通过元数据管理引擎,对每条通道设置一种数据处理方式,将数据处理为元数据,并提取数据的关键词作为通道标准数据关键词;所述数据封装包括:将所述数据预处理得到的元数据、通道ID、文件格式、关键词、物理存储地址封装形成通道标准数据;所述通道数据融合包括:采用词目链接策略和目目关联策略将所述通道标准数据融合到通道耦合知识图谱中,其中,所述词目链接策略,即采用剪枝策略将通道标准数据关键词与通道耦合知识图谱逐层匹配,将匹配成功的通道标准数据链接到通道耦合知识图谱的“细目”;所述目目关联策略,即当多个“细目”共同链接同一通道标准数据时,将“细目”之间彼此关联;所述基于通道耦合知识图谱实现数据检索,包括:采用剪枝策略将目标词与通道耦合知识图谱逐层匹配,得到匹配得分最大的目标“细目”,并计算所述目标“细目”的所有一步关联“细目”与目标词的匹配得分,读取匹配得分大于设定阈值的“细目”所链接的通道标准数据,索引物理存储地址并展示;其中,所述一步关联“细目”为链接相同通道标准数据的“细目”。2.如权利要求1所述的多源异构信息通道耦合方法,其特征在于:所述元数据的类型包括文本、视频、传感、图像、定位、结构化和非结构化数据。3.如权利要求1所述的多源异构信息通道耦合方法,其特征在于:所述匹配通过计算语义向量间的余弦相似度完成。4.如权利要求1所述的多源异构信息通道耦合方法,其特征在于,所述词目链接策略具体包括以下步骤:第一步,判断通道标准数据中是否有通道标准数据关键词,如果没有,标记人工处理,并结束;如果有,依次执行通道标准数据关键词与“类”、“项”、“目”、“细目”匹配;第二步,匹配“类”,设置类匹配阈值,如果匹配得分高于类匹配阈值,则将所匹配到的“类”放在“类”列表中,依次匹配,直至匹配所有的“类”;第三步,判定“类”列表中是否有值,如果没有,则标记该关键词,并回到第一步循环;如果有,则对“类”列表中的“类”执行下一步操作;第四步,匹配“项”,设置项匹配阈值,如果匹配得分高于项匹配阈值,则将所匹配到的“项”放在“项”列表中,依次匹配,直至匹配所有的“项”;第五步,判定“项”列表中是否有值,如果没有,则标记该关键词,并回到第一步循环;如果有,则对“项”列表中的“项”执行下一步操作;第六步,匹配“目”,设置目匹配阈值,如果匹配得分高于目匹配阈值,则将所...

【专利技术属性】
技术研发人员:李红辉韩铖山张大林闫佳和林映利屈靖淇贾志伟
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1