当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于本体的供应商数据分析方法及分析系统技术方案

技术编号:20820060 阅读:37 留言:0更新日期:2019-04-10 05:58
本发明专利技术涉及一种基于本体的供应商数据分析方法及分析系统,所述分析方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果,其中,所述语义层的构建具体包括以下步骤:1)爬取供应商相关Web数据;2)基于所述供应商相关Web数据构建供应商局部本体;3)分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。与现有技术相比,本发明专利技术将互联网中供应商数据解析为文本数据和结构化数据,并将二者分别构建供应商局部本体,通过本体映射技术,完成领域本体与局部本体以及局部本体与数据库的映射,实现语义查询,确保查询数据的准确性和高效性。

【技术实现步骤摘要】
一种基于本体的供应商数据分析方法及分析系统
本专利技术涉及工业数据集成领域,尤其是涉及一种基于本体的供应商数据分析方法及分析系统。
技术介绍
随着信息技术的发展,越来越多的数据采用电子化形式存储,以提高数据存储的便捷高效性,同时可以根据这些数据进行后期的分析。而工业大数据分析的数据量越大,从中分析得到的有效的、有价值的判断就越多。由于工业信息资源具有异质、异构的特征,缺乏统一的数据标准规范,工业数据集成难度较大,因此给数据分析带来了一系列问题。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于本体的供应商数据分析方法。本专利技术的目的可以通过以下技术方案来实现:一种基于本体的供应商数据分析方法,该方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果,其中,所述语义层的构建具体包括以下步骤:1)爬取供应商相关Web数据;2)基于所述供应商相关Web数据构建供应商局部本体;3)分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。进一步地,所述供应商局部本体描述有供应商概念及其关系。进一步地,所述步骤2)中,构建供应商局部本体具体为:将所述供应商相关Web数据解析为文本数据和结构化数据,分别基于所述文本数据和结构化数据构建对应的供应商局部本体。进一步地,基于所述文本数据构建供应商局部本体的过程包括:A1)使用自然语言处理技术对所述文本数据进行处理;A2)从步骤A1)获得的数据中抽取概念及概念关系;A3)根据步骤A2),利用Jena进行供应商局部本体构建。进一步地,基于所述结构化数据构建供应商局部本体的过程包括:利用D2RQ映射引擎将结构化数据转换为RDF格式数据,构建供应商局部本体。进一步地,所述供应商局部本体与供应商全局本体的映射规则包括:如果2个类有相同的父类和子类,那么2个类可能相同;如果2个类有相同的实例或相同的属性,那么2个类可能相同;如果2个属性存在相同的定义域和值域,那么这2个属性可能相同;如果2个属性的父属性或子属性相同,那么这2个属性可能相同。进一步地,所述供应商局部本体与数据库的映射规则包括:局部本体中的概念对应到关系数据库中表名;局部本体中的属性与关系数据库中的属性列相对性;将局部本体中的关系对应到关系数据库中外键。本专利技术还提供一种基于本体的供应商数据分析系统,包括:请求获取模块,用于获取用户分析请求;算法调用模块,用于根据所述用户分析请求调用相应的供应商数据分析算法;查询模块,用于根据所述供应商数据分析算法,利用本体语义查询方法在语义层中查询获得所需的供应商数据;数据调用模块,用于根据所述查询模块的查询结果在存储层进行所需供应商数据调用;分析模块,用于根据所述供应商数据分析算法和供应商数据获得分析结果并输出;所述语义层具有供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系。与现有技术相比,本专利技术将本体引入到供应商数据分析中,确保了供应商数据的语义统一,保障了对多源异构的供应商数据分析准确性,具有以如下有益效果:1)本专利技术将供应商Web数据解析为文本数据以及结构化数据,并分别构建供应商局部本体,通过建立已有的供应商领域本体与供应商局部本体以及供应商局部本体与数据库的映射规则作为语义层,支持供应商数据的语义查询,同时能够为供应商数据分析提供数据。2)本专利技术通过本体来实现语义的查询,解决了工业大数据多源异构等导致的信息孤岛问题。本体可实现形式化地描述概念,从而作为语义的共享模型,为语义集成提供重要的技术支持。3)本专利技术供应商数据解析为文本数据以及结构化数据,按不同方式构建相应的供应商局部本体,全面可靠。4)本专利技术构建语义层,提供了数据分析的语义查询转换功能,且语义层的构建,考虑特定映射规则,方便可靠地实现供应商局部本体与已有领域本体以及数据库的映射工作。5)本专利技术在方法层面与技术层面为供应商数据分析提供解决方案,为供应商选择提供意见。附图说明图1为爬取的供应商文本类型数据实例;图2为爬取的供应商结构化数据实例;图3为基于文本构建供应商本体的流程示意图;图4为基于结构化数据构建供应商本体的流程示意图;图5为查询过程示意图;图6为基于本体的供应商数据分析流程示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。如图6所示,本实施例提供一种基于本体的供应商数据分析方法,该方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果。其中,语义层的构建具体包括:步骤1:爬取供应商相关Web数据。步骤2:基于供应商相关Web数据构建供应商局部本体,具体为:将供应商相关Web数据解析为文本数据和结构化数据,分别基于文本数据和结构化数据构建对应的供应商局部本体。如图1所示,Web数据中关于供应商的相关简介内容为可以存储为文本数据。结构化数据如图2所示,有一定的表格格式可以转化为结构化数据进行存储。供应商局部本体描述有供应商概念及其关系。供应商概念涵盖了供应商信息、产品信息、法人代表等。如图3所示,基于文本数据构建供应商局部本体的过程包括:A1)使用自然语言处理技术对文本数据进行处理,包括分词、词性标注以及停用词过滤,为接下来的本体概念抽取以及概念关系抽取做准备。A2)从步骤A1)获得的数据中抽取概念及概念关系。概念抽取:采用基于规则和统计的方法抽取概念,首先利用词法及句法建立规则,实现对多词短语的抽取,然后使用改进的TF-IDF算法来对概念进行过滤。关系抽取:概念关系包括分类关系和非分类关系,采用基于规则的方法抽取分类关系,同时采用关联规则及依存句法分析来进行非分类关系抽取。A3)根据步骤A2),利用Jena进行供应商局部本体构建,基于Protégé可视化本体。如图4所示,基于结构化数据构建供应商局部本体的过程包括:利用D2RQ映射引擎将结构化数据转换为RDF格式数据,构建供应商局部本体。步骤3:分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。本体映射是利用映射规则,完成供应商局部本体与已有领域本体以及数据库的映射工作。供应商局部本体与供应商全局本体的映射规则包括:如果2个类有相同的父类和子类,那么2个类可能相同;如果2个类有相同的实例或相同的属性,那么2个类可能相同;如果2个属性存在相同的定义域和值域,那么这2个属性可能相同;如果2个属性的父属性或子属性相同,那么这2个属性可能相同。供应商局部本体与数据库的映射规则包括:局部本体中的概念对应到关系数据库中表名;局部本体中的属性与关系数据库中的属性列相对性;将局部本体中的关系对应到关系数据库中外键。基于上述供应商数据分析方法,本实施例可提供一种供应商数据分析系统,包括:请求获取模块,用于获取用户分析请求;算法调用模块,用于根据用户分析请求调用相应的供应商数据分析算法;查询模块,用于根据供应商数据分析算法,利用本体语义查询方法在语义层中查询获得所需的供应商数据;数据调用模块,用于根据查询模块的查询结果在存储层进行所需供应商数据调本文档来自技高网...

【技术保护点】
1.一种基于本体的供应商数据分析方法,其特征在于,该方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果,其中,所述语义层的构建具体包括以下步骤:1)爬取供应商相关Web数据;2)基于所述供应商相关Web数据构建供应商局部本体;3)分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。

【技术特征摘要】
1.一种基于本体的供应商数据分析方法,其特征在于,该方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果,其中,所述语义层的构建具体包括以下步骤:1)爬取供应商相关Web数据;2)基于所述供应商相关Web数据构建供应商局部本体;3)分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。2.根据权利要求1所述的基于本体的供应商数据分析方法,其特征在于,所述供应商局部本体描述有供应商概念及其关系。3.根据权利要求1所述的基于本体的供应商数据分析方法,其特征在于,所述步骤2)中,构建供应商局部本体具体为:将所述供应商相关Web数据解析为文本数据和结构化数据,分别基于所述文本数据和结构化数据构建对应的供应商局部本体。4.根据权利要求3所述的基于本体的供应商数据分析方法,其特征在于,基于所述文本数据构建供应商局部本体的过程包括:A1)使用自然语言处理技术对所述文本数据进行处理;A2)从步骤A1)获得的数据中抽取概念及概念关系;A3)根据步骤A2),利用Jena进行供应商局部本体构建。5.根据权利要求3所述的基于本体的供应商数据分析方法,其特征在于,基于所述结构化数据构建供应商局部本体的过程包括:利用D2RQ映射引擎将结构化数据转换...

【专利技术属性】
技术研发人员:王坚凌卫青陈诗芸
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1