【技术实现步骤摘要】
数据资源地图的构建方法及装置、存储介质、终端
本专利技术涉及数据处理领域,尤其涉及一种数据资源地图的构建方法及装置、存储介质、终端。
技术介绍
在数据处理领域,经常存在数据供方作为对数据进行处理的主体,向他人(如数据需方)提供数据的行为,可以包括与他人分享、互换、提供复本等行为,其中,所述数据是经过合法生成、采集、取得的。数据供方为提供数据的主体,又称为数据提供人,数据需方为接受数据主体,又称为数据接受人。随着数据需方的需求呈现出多元化、深层化的趋势,亟需一种数据资源地图的构建方法,使数据需方在提出订单需求后,有机会获得更加丰富、灵活的数据资源。
技术实现思路
本专利技术解决的技术问题是如何提供一种数据资源地图的构建方法及装置、存储介质、终端,以使数据需方在提出订单需求后,有机会获得更加丰富、灵活的数据资源。为解决上述技术问题,本专利技术实施例提供一种数据资源地图的构建方法,包括以下步骤:接收数据需方的订单信息,所述订单信息包括数据交易品需求以及订单明细需求;根据所述数据交易品需求确定政务数据源以及开放数据源;对所述政务数据源以及开放数据源进行抽取,并构建资源知识图谱;根据所述订单明细需求确定交易数据源;对所述交易数据源进行抽取,并构建交易数据知识图谱;对所述资源知识图谱以及所述交易数据知识图谱进行存储,以得到所述数据资源地图。可选的,所述数据交易品需求包括数据交易品的概括类别信息;根据数据交易品需求确定政务数据源以及开放数据源包括:根据数据交易品的概括类别信息,采集所述数 ...
【技术保护点】
1.一种数据资源地图的构建方法,其特征在于,包括以下步骤:/n接收数据需方的订单信息,所述订单信息包括数据交易品需求以及订单明细需求;/n根据所述数据交易品需求确定政务数据源以及开放数据源;/n对所述政务数据源以及开放数据源进行抽取,并构建资源知识图谱;/n根据所述订单明细需求确定交易数据源;/n对所述交易数据源进行抽取,并构建交易数据知识图谱;/n对所述资源知识图谱以及所述交易数据知识图谱进行存储,以得到所述数据资源地图。/n
【技术特征摘要】
1.一种数据资源地图的构建方法,其特征在于,包括以下步骤:
接收数据需方的订单信息,所述订单信息包括数据交易品需求以及订单明细需求;
根据所述数据交易品需求确定政务数据源以及开放数据源;
对所述政务数据源以及开放数据源进行抽取,并构建资源知识图谱;
根据所述订单明细需求确定交易数据源;
对所述交易数据源进行抽取,并构建交易数据知识图谱;
对所述资源知识图谱以及所述交易数据知识图谱进行存储,以得到所述数据资源地图。
2.根据权利要求1所述的数据资源地图的构建方法,其特征在于,所述数据交易品需求包括数据交易品的概括类别信息;
根据数据交易品需求确定政务数据源以及开放数据源包括:
根据数据交易品的概括类别信息,采集所述数据交易品涉及的地区信息和行业信息,以作为所述政务数据源;
根据数据交易品的概括类别信息,采集所述数据交易品涉及的机构信息、类目信息、所述数据交易品挂载的互联对象,以作为所述开放数据源。
3.根据权利要求2所述的数据资源地图的构建方法,其特征在于,对所述政务数据源以及开放数据源进行抽取,并构建资源知识图谱包括:
对所述政务数据源进行第一数据提取,以得到政务数据提取层数据,对所述开放数据源进行第二数据提取,以得到开放数据提取层数据;
对所述政务数据提取层数据进行实体抽取,以得到政务图谱实体数据,对所述开放数据提取层数据进行实体抽取,以得到开放图谱实体数据;
对所述政务图谱实体数据进行关系抽取,以得到政务图谱实体关系,对所述开放图谱实体数据进行关系抽取,以得到开放图谱实体关系;
将所述政务图谱实体数据与所述政务图谱实体关系导入数据库,以构建政务知识图谱,将所述开放图谱实体数据与所述开放图谱实体关系导入数据库,以构建开放知识图谱,其中,所述资源知识图谱包括所述政务知识图谱与所述开放知识图谱。
4.根据权利要求3所述的数据资源地图的构建方法,其特征在于,
所述政务知识图谱包括以下一项或多项:类目、交易品、机构;
所述开放知识图谱包括以下一项或多项:地区、行业。
5.根据权利要求2所述的数据资源地图的构建方法,其特征在于,对所述政务数据源以及开放数据源进行抽取,并构建资源知识图谱包括:
对所述政务数据源进行第一数据提取,以得到政务数据提取层数据,对所述开放数据源进行第二数据提取,以得到开放数据提取层数据;
对所述政务数据提取层数据进行实体抽取,以得到政务图谱实体数据,对所述开放数据提取层数据进行实体抽取,以得到开放图谱实体数据,对所述政务图谱实体数据与所述开放图谱实体数据进行整合,以得到图谱实体数据;
对所述图谱实体数据进行关系抽取,以得到图谱实体关系;
将所述图谱实体数据与所述图谱实体关系导入数据库以构建所述资源知识图谱。
6.根据权利要求3或5所述的数据资源地图的构建方法,其特征在于,
采用Excel数据提取方式,对所述政务数据源进行第一数据提取;
和/或,
采用数据库数据提取方式,对所述开放数据源进行第二数据提取。
7.根据权利要求2所述的数据资源地图的构建方法,其特征在于,对所述政务数据源以及开放数据源进行抽取,并构建资源知识图谱包括:
采用文件解析器对所述政务数据源以及开放数据源进行结构化数据抽取,并将抽取出的数据拼接成表格;
对所述表格提取有效字段,并导入预设数据库进行存储,以得到所述资源知识图谱。
8.根据权利要求7所述的数据资源地图的构建方法,其特征在于,所述文件解析器为PDF文件解析器;
采用文件解析器对所述政务数据源以及开放数据源进行结构化数据抽取,并将抽取出的数据拼接成表格包括:
采用Camelot库,识别PDF文档中特定页的表格;
将从每页识...
【专利技术属性】
技术研发人员:汤奇峰,蒋宇一,郭泽卿,
申请(专利权)人:上海数据交易中心有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。