【技术实现步骤摘要】
基于核电厂PaaS平台的数据资产标签体系建设方法及系统
[0001]本专利技术属于大数据分析技术中标签体系建设领域,具体涉及一种基于核电厂PaaS平台的数据资产标签体系建设方法及系统。
技术介绍
[0002]数据资产是指由个人或企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源。在核电厂的生产和运行过程中产生的设计图、专利、论文、经营记录、业务报告等等相关的以物理或电子形式存储的数据资源都是核电厂的数据资产。如何管理和利用这些数据资产,为核电厂的运营和生产创造更高的效益,是目前的一个难题。针对数据资产进行标签体系的构建,可以从多个维度对数据资产的特征进行刻画,同时为以后依托核电厂PaaS平台,利用大数据处理技术从海量数据中挖掘出隐藏的关联关系和潜在特性提供了基础。目前由于核电行业的特殊性,缺乏现成的针对核电厂数据资产构建标签体系的方法。
[0003]受限于核电厂数据资产的特殊性,现有的标签体系建设方法都是与其他领域相适应的,而缺乏直接与核电厂数据资产相配套的标签体系建设方法。针对核电厂 ...
【技术保护点】
【技术特征摘要】
1.基于核电厂PaaS平台的数据资产标签体系建设方法,其特征在于,包括以下步骤:步骤001:利用数据抽取模块,根据预先设置的类别,从核电厂PaaS平台中抽取与类别相关的原始数据,其中预先设置的类别可以是数据资产文件格式类别、数据资产文件上传时间类别、数据资产所属单位类别、数据资产文件性质类别和数据资产内容信息关键字类别;步骤002:将抽取到的原始数据信息传入到数据处理模块,对原始数据进行数据清洗和数据合并操作,得到预先设置的类别以及相对应的特征数据和特征所包含字段信息;步骤003:将处理得到的预先设置的类别所对应的特征数据和特征所包含的字段,导入到主特征字段选取模块,之后主特征字段选取模块根据传入的数据和信息,针对每个预先设置的类别的字段信息,从中选取主特征字段,并且根据主特征字段对应的特征数据,确定与之对应的预先设置的类别所对应的标签;步骤004:将处理得到的预先设置的类别所对应的特征数据和特征对应的字段,导入到副特征字段选取模块中,之后,副特征字段选取模块会从所有预先设置的类别对应的特征信息所包含的字段中选取出副特征字段,并且将副特征字段对应的特征数据传入事务性质预测模块;步骤005:事务性质预测模块利用训练好的softmax分类模型,根据传入的特征数据对数据资产的事务性质进行预测;步骤006:根据各项预先设置的类别所对应的标签和事务类型预测标签,建立数据资产的标签体系;步骤007:将建立好的数据资产的标签体系上传并保存。2.基于核电厂PaaS平台的数据资产标签体系建设方系统,其特征在于:包括数据抽取模块,数据处理模块,主特征字段选取模块,副特征字段选取模块,事务性质预测模块,事务预测模型训练模块,标签体系建立模块,标签体系保存模块。3.如权利要求2所述的基于核电厂PaaS平台的数据资产标签体系建设方系统,其特征在于:所述的数据抽取模块:根据核电厂运行和管理的相关资料,确定考察数据资产的特征信息的类别,这些类别统称为预先设置类别,包含:安全、生产、管理,以此为依据从核电厂PaaS平台的数据源中抽取与数据资产相关的原始数据,然后传入到数据处理模块。4.如权...
【专利技术属性】
技术研发人员:周方禹,汪淑平,朱恋,庄少清,李建池,黄萍,李志昂,曹中才,胡芳,李慧,
申请(专利权)人:核动力运行研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。