当前位置: 首页 > 专利查询>魏艳华专利>正文

基于大数据的信息数据存储整合系统技术方案

技术编号:37257786 阅读:11 留言:0更新日期:2023-04-20 23:33
本发明专利技术公开了基于大数据的信息数据存储整合系统,包括S101、大数据获取相关风电数据;S102、对获取到的数据进行数据处理;S103、对处理后的数据进一步整合以构建知识图谱;S104、将整合完成的风电数据存储于数据库中;所述大数据获取相关风电数据的步骤包括:相关风电数据主要包括风机传回的传感器数据以及围绕风机产生的运维数据、定期巡检数据、设备采购数据、维修数据;所述对获取到的数据进行数据处理的步骤包括:对获取到的非结构化数据进行处理;通过采用基于统计学的有向图概率模型结合风电专业术语,将风电数据文本切割为单独的词,本发明专利技术,具有有效安全存储和高效整合管理的特点。的特点。的特点。

【技术实现步骤摘要】
基于大数据的信息数据存储整合系统


[0001]本专利技术涉及大数据
,具体为基于大数据的信息数据存储整合系统。

技术介绍

[0002]在传统能源日渐枯竭的背景下,当今国际开始大力发展以风能发电为代表的清洁能源。随着相关技术的日渐成熟和风电行业的发展,行业内产生的相关数据在来源和数量上都达到了一个新的高度。在大数据技术潮流下,人们意识到这些风电数据中隐藏着巨大的价值,若能对其高效地管理并利用,则对风电行业有着巨大的促进作用。然而实际上风电数据却因格式、类型、用途等原因被孤立的存储在各个业务部门中,数据之间无法有效整合,难以整合不同来源、不同结构、不同类型的数据,做到跨业务、跨时间、跨类型的全景数据挖掘分析,给风电数据存储和管理带来了巨大的阻碍。因此,设计有效安全存储和高效整合管理的基于大数据的信息数据存储整合系统是很有必要的。

技术实现思路

[0003]本专利技术的目的在于提供基于大数据的信息数据存储整合系统,以解决上述
技术介绍
中提出的问题。
[0004]为了解决上述技术问题,本专利技术提供如下技术方案:基于大数据的信息数据存储整合系统,该系统所运行的方法包括:大数据获取相关风电数据;对获取到的数据进行数据处理;对处理后的数据进一步整合以构建知识图谱;将整合完成的风电数据存储于数据库中。
[0005]根据上述技术方案,所述大数据获取相关风电数据的步骤包括:相关风电数据主要包括风机传回的传感器数据,以及围绕风机产生的运维数据、定期巡检数据、设备采购数据、维修数据。
[0006]根据上述技术方案,所述对获取到的数据进行数据处理的步骤包括:对获取到的非结构化数据进行处理;通过采用基于统计学的有向图概率模型结合风电专业术语,将风电数据文本切割为单独的词;将上一步中切分好的词逐一在领域专业术语集中进行匹配;通过词嵌入算法对抽取的实体/属性进行降维操作;进一步通过语言表征模型对风电数据进行关系抽取。
[0007]根据上述技术方案,所述对处理后的数据进一步整合以构建知识图谱的步骤包括:将风电数据中自动抽取出的实体、关系、属性整合成为“实体—关系—实体”的三元组;
得到三元组后,将其导入图形数据库中,输出构建完成的风电数据知识图谱。
[0008]根据上述技术方案,所述将整合完成的风电数据存储于数据库中的步骤包括:系统采用角色授权的方式,每个角色由超级管理员或者经过具有修改角色权限的系统管理员授予角色权限,再把用户账号关联到所需的角色,从而获得这个角色的操作权限。
[0009]根据上述技术方案,所述该系统包括:风电数据获取模块,用于获取风电数据;风电数据处理模块,用于对获取到的风电数据进行处理;风电数据整合模块,用于对处理后的风电数据进行整合;安全存储利用模块,用于对整合后的风电数据安全存储。
[0010]根据上述技术方案,所述风电数据处理模块包括:非结构化数据处理模块,用于对非结构化数据进行处理;非结构化数据处理模块包括:实体属性抽取单元,用于抽取数据中的实体和属性;词性降维单元,用于根据词性对抽取出的实体和属性进行降维处理;关系抽取单元,用于抽取数据中的关系。
[0011]根据上述技术方案,所述风电数据整合模块包括:数据整合模块,用于对数据进行整合处理;知识图谱构建模块,用于根据整合后的数据构建知识图谱;错误检测模块,用于对输出的知识图谱进行错误检测;周期更新模块,用于根据设置的周期对知识图谱定期更新。
[0012]根据上述技术方案,所述安全存储利用模块包括:安全存储模块,用于对风电数据进行安全存储;权限管理模块,用于对系统进行权限管理。
[0013]与现有技术相比,本专利技术所达到的有益效果是:本专利技术,通过设置有风电数据获取模块、风电数据处理模块、风电数据整合模块和安全存储利用模块,大数据获取相关风电数据;将风电数据中自动抽取出的实体、关系、属性整合成为“实体—关系—实体”的三元组,将分散在系统中的多源异构数据进行有效整合,形成完整的数据视图并安全存储于数据库中,使得大量的风电数据得以有效利用,有利于风电机组工作人员实时查看其运行状态,提高管理效率,通过完整的整合知识图谱,给工作人员提供有效的风电数据挖掘利用的数据支持,同时,对于整合后的知识图谱,通过预先设置的实体间规则,对知识图谱进行准确性检测,判断是否存在节点冲突或关系缺失;当有用户需要调取利用存储的数据时,需经过管理人员的权限确认,同时用户的每一项操作都将被记录于系统日志中,以保证数据的安全存储以及杜绝工作人员的误操作和恶意操作行为。
附图说明
[0014]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1是本专利技术实施例一提供的基于大数据的信息数据存储整合方法的流程图;
图2是本专利技术实施例二提供一种基于大数据的信息数据存储整合系统的模块构成示意图。
具体实施方式
[0015]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]实施例一:图1为本专利技术实施例一提供的基于大数据的信息数据存储整合方法的流程图,该方法可以由本专利技术实施例提供的基于大数据的信息数据存储整合系统来执行,该系统由多个软硬件模块组成,如图1所示,该方法具体包括以下步骤:S101、大数据获取相关风电数据;在本专利技术的一些实施例中,相关风电数据主要包括风机传回的传感器数据,用于表现其运行状态,以及围绕风机产生的运维数据、定期巡检数据、设备采购数据、维修数据等。
[0017]示例性的,在本专利技术实施例中,风机传回的传感器数据包括温度传感器、加速度传感器、压力传感器、振动传感器等大量的传感器,以监控风机各个部件的工作状态,并通过数据采集与监视控制系统进行汇集,在本专利技术实施例中,最终通过大数据获取汇集数据。
[0018]示例性的,在本专利技术实施例中,风电数据具有规模大、速率高、类型多样和价值高等特点,因此对该类数据进行高效整合存储,有利于风电机组工作人员实时查看其运行状态,提高管理效率,通过完整的整合知识图谱,给工作人员提供有效的风电数据挖掘利用的数据支持,有助于其对风机进行故障智能诊断、设备采购、对风机健康状态进行监测,从而节省时间,快速找寻引起故障或失效的原因,提高产品质量,延长产品寿命。
[0019]S102、对获取到的数据进行数据处理;在本专利技术的一些实施例中,对获取到的非结构化数据进行处理。
[0020]示例性的,在本专利技术实施例中,非结构化数据主要指文本类风电数据,以自然语言形式存在,在构建知识图谱前需要抽取文本中的实体、关系、属性等元素。
[0021]在本专利技术实施例中,实体/属性抽取是从非结构化风电数据中抽取出表示实体/属性的词,首先进行分词,具体的采用基于统计学的有向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于大数据的信息数据存储整合系统,其特征在于,该系统所运行的方法包括:大数据获取相关风电数据;对获取到的数据进行数据处理;对处理后的数据进一步整合以构建知识图谱;将整合完成的风电数据存储于数据库中。2.根据权利要求1所述的基于大数据的信息数据存储整合系统,其特征在于:所述大数据获取相关风电数据的步骤包括:相关风电数据主要包括风机传回的传感器数据,以及围绕风机产生的运维数据、定期巡检数据、设备采购数据、维修数据。3.根据权利要求1所述的基于大数据的信息数据存储整合系统,其特征在于:所述对获取到的数据进行数据处理的步骤包括:对获取到的非结构化数据进行处理;通过采用基于统计学的有向图概率模型结合风电专业术语,将风电数据文本切割为单独的词;将上一步中切分好的词逐一在领域专业术语集中进行匹配;通过词嵌入算法对抽取的实体/属性进行降维操作;进一步通过语言表征模型对风电数据进行关系抽取。4.根据权利要求1所述的基于大数据的信息数据存储整合系统,其特征在于:所述对处理后的数据进一步整合以构建知识图谱的步骤包括:将风电数据中自动抽取出的实体、关系、属性整合成为“实体—关系—实体”的三元组;得到三元组后,将其导入图形数据库中,输出构建完成的风电数据知识图谱。5.根据权利要求1所述的基于大数据的信息数据存储整合系统,其特征在于:所述将整合完成的风电数据存储于数据库中的步骤包括:系统采用角色授权的方式,...

【专利技术属性】
技术研发人员:魏艳华
申请(专利权)人:魏艳华
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1