一种油品质量群落分析系统技术方案

技术编号:22295982 阅读:72 留言:0更新日期:2019-10-15 05:03
本发明专利技术公开了一种油品质量群落分析系统,其包括数据获取模块,其获取用于建立油品分类模型的油品样本数据,特征筛选模块,其对获取的油品样本数据进行分析,确定用来建立油品分类模型的油品属性特征,分类划分模块,其根据油品分类模型将油品样本数据划分成若干类别,无监督聚类模块,其根据油品间的相似性,利用无监督聚类模型将经过分类划分的油品样本数据的每一类细分成若干个群落,群落分析模块,其对划分后的各个油品群落进行特征归纳和油品画像,并分析各群落间的油品差异,基于油品质量群落分析结果,进一步刻画出供应商的油品特点和不同供应商之间的油品差异,检验新进油品,判断其油品特征,并据此对容易出现问题的油品进行风险预警。

A Community Analysis System for Oil Quality

【技术实现步骤摘要】
一种油品质量群落分析系统
本专利技术涉及油品质量数据检验分析技术,尤其涉及一种油品质量群落分析系统。
技术介绍
当前,油品质量主要是通过实验室信息管理系统(LaboratoryInformationManagementSystem,以下简称LIMS)来进行管理,世界上最早的LIMS(1982年术语提出)应用起源于20世纪60年代末美国的一些高等学校、研究所和化学公司。历经了研究、发展、商品化三个阶段。之后随着计算机技术、网络通讯技术、数据库和仪器仪表的飞速发展,LIMS技术的应用进入了一个崭新的时代,世界上著名的艾克森美孚(Exxon-Mobil)石油公司,壳牌(Shell)石油公司等早已推广应用了LIMS技术。LIMS主要面向实验室工作人员和质量管理技术人员。LIMS的广泛应用,无疑为实验室管理人员带来了很大的方便。近年,在油品质量处理方面出现了以谱库为基础的专业方法,以及图象分析系统、专家系统等,但是对质量结果的深层次挖掘应用却比较薄弱。尤其随着大数据技术的发展,越发显得LIMS数据的分析应用需要加强。如何依托于现有的LIMS系统,以炼厂用于品油、外采供应商成品油以及区域性市场成品油质量数据库中的历史沉淀数据以及当前质量数据为基础,使用数据驱动的方式对现有产品质检数据进行深入的分析与挖掘,结合业内先进的大数据处理、整合、分析与展现技术,为中国石化全面提升成品油在采购、供应商、质量追溯、质检系统等方面的质量管控水平,为科学决策提供量化的信息辅助支持显得尤为迫切。
技术实现思路
针对上述问题,本专利技术提出了一种油品质量群落分析系统。该系统主要包括:数据获取模块,其用于获取用来建立油品分类模型的油品样本数据;特征筛选模块,其用于对获取的油品样本数据进行分析,确定用来建立油品分类模型的油品属性特征;分类划分模块,其用于根据油品分类模型将油品样本数据划分成若干类别;无监督聚类模块,其用于根据油品间的相似性,利用无监督聚类模型将经过分类划分的油品样本数据的每一类细分成若干群落;群落分析模块,其用于对划分后的各个油品群落进行特征归纳和油品画像,并对各个群落间的油品差异进行分析。根据本专利技术的实施例,上述油品质量群落分析系统中,所述数据获取模块主要包括:数据获取单元,其用于获取由LIMS系统提供的油品检测数据;数据清洗单元,其用于对所述油品检测数据进行清洗,所述清洗包括删除异常值;数据变换单元,其用于对经过清洗的油品检测数据进行变换,使之成为能够用于建立油品分类模型的油品样本数据,所述变换包括统一量纲和/或数据结构变换。根据本专利技术的实施例,上述油品质量群落分析系统中,所述特征筛选模块,优选地根据油品样本数据的缺失情况、业务重要性及模型特点,筛选出用来建立油品分类模型的油品属性特征。根据本专利技术的实施例,上述油品质量群落分析系统中,所述分类划分模块主要包括:业务划分单元,其用于根据油品来源对油品样本数据进行初步划分;分类监督划分单元,其用于基于筛选出的油品属性特征建立油品分类模型,利用所述油品分类模型对经过业务划分的油品样本数据进行进一步划分。根据本专利技术的实施例,上述业务划分单元,优选地根据油品来源将油品样本数据初步划分为配置油和外采油两种类型;上述分类监督划分单元建立决策树分类模型作为油品分类模型,利用所述决策树分类模型将划分为配置油和外采油的油品样本数据进一步划分为四种类型:典型外采油、典型配置油、类配置外采油和类外采配置油。又或者,根据本专利技术的另一个实施例,上述分类划分模块仅包括业务划分单元,其用于根据油品来源将油品样本数据划分为配置油和外采油两种类型。根据本专利技术的实施例,上述油品质量群落分析系统中,所述无监督聚类模块主要包括:指标选择单元,其用于根据待聚类的油品样本数据的缺失情况、业务重要性及模型特点确定进行聚类分析的油品检测指标;数据填补单元,其用于基于中位数填补法对所述油品检测指标的油品样本数据中的缺失值进行插补填充;聚类处理单元,其用于利用K-means无监督聚类模型将经过填补的油品样本数据细分成若干个群落。对于前述所述分类划分模块包括业务划分单元和分类监督划分单元的情况,所述无监督聚类模块对分成典型外采油、典型配置油、类配置外采油和类外采配置油四种类型的油品样本数据的每一类进行聚类处理。对于前述所述分类划分模块仅仅包括业务划分单元的情况,所述无监督聚类模块对分成配置油和外采油两种类型的油品样本数据的每一类进行聚类处理。根据本专利技术的实施例,上述油品质量群落分析系统还可以包括:业务分析模块,其用于根据各个群落的油品特点和/或各个群落的油品差异分析各个群落中油品供应商分布情况和各个油品供应商的群落分布情况,从而获得各个油品供应商的油品特点和不同油品供应商之间的油品差异。根据本专利技术的实施例,上述油品质量群落分析系统还可以包括:新油品检测模块,其用于通过判断新进油品样本数据所落入的群落来判断所述新进油品的特点。根据本专利技术的实施例,上述油品质量群落分析系统还可以包括:群落分级模块,其用于根据群落的油品特点确定各项检测指标的分值和权重,计算群落得分,然后根据群落得分情况对群落进行评级;质量预警模块,其用于对落入不合格级别的群落的新进油品给予警示。与现有技术相比,本专利技术的一个或多个实施例可以具有如下优点:1、本专利技术提供的油品质量群落分析系统能够对油品特征进行识别与分析,通过油品检测数据建立油品特征模型,寻找油品检测指标之间的相关性,并优选地通过业务划分、分类监督划分和无监督聚类的划分方法,将所有入检的油品划分成各个群落,详细刻画出各群落油品特点,从而能够发现典型的油品类型差异,例如不同批次的油品差异、不同厂家的油品差异等。2、本专利技术提供的油品质量群落分析系统能够从群落的供应商分布和供应商的群落分布两个角度进一步刻画出供应商的油品特点和不同供应商之间的油品差异,将不同油品群落的关键指标和对应的业务含义标签化。3、本专利技术提供的油品质量群落分析系统能够对于新检测的油品,根据其落入的群落,辅助性地判断其油品特征,对落入得分低群落的油品进行预警,提前发现易出现问题油品,优化卡边油品,大幅度地提高了中国石化油品质量的风险管控能力。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例共同用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1是本专利技术提供的油品质量群落分析系统的工作原理图;图2是本专利技术实施例一提供的油品质量群落分析系统的组成结构示意图;图3是图2所示的油品质量群落分析系统的工作流程图;图4是图2所示的油品质量群落分析系统对于92号汽油指标通过决策树分类分析获得的重要性的排布图;图5是图2所示的油品质量群落分析系统对于92号汽油指标获得的决策树分类结果的统计表;图6示出的是本专利技术实施例一所获得的四类油品的各个指标的中位数;图7示出的是本专利技术实施例一所获得的四类油品的特点;图8示出的是本专利技术实施例一所获得的典型配置油群落细分结果;图9示出的是本专利技术实施例一所获得的典型外采油群落细分结果;图10示出的是本专利技术实施例一所获得的外采油生产型供应商油品群落细分结果;图11是本专利技术实施例三提供的油品质量群落分析系统的质量预警模块的工作原理图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,以下本文档来自技高网...

【技术保护点】
1.一种油品质量群落分析系统,其特征在于,包括:数据获取模块,其用于获取用来建立油品分类模型的油品样本数据;特征筛选模块,其用于对获取的油品样本数据进行分析,确定用来建立油品分类模型的油品属性特征;分类划分模块,其用于根据油品分类模型将油品样本数据划分成若干类别;无监督聚类模块,其用于根据油品间的相似性,利用无监督聚类模型将经过监督分类划分的油品样本数据的每一类进一步细分成若干个群落;群落分析模块,其用于对划分后的各个群落进行特征归纳和油品画像,并对各个群落间的油品差异进行分析。

【技术特征摘要】
1.一种油品质量群落分析系统,其特征在于,包括:数据获取模块,其用于获取用来建立油品分类模型的油品样本数据;特征筛选模块,其用于对获取的油品样本数据进行分析,确定用来建立油品分类模型的油品属性特征;分类划分模块,其用于根据油品分类模型将油品样本数据划分成若干类别;无监督聚类模块,其用于根据油品间的相似性,利用无监督聚类模型将经过监督分类划分的油品样本数据的每一类进一步细分成若干个群落;群落分析模块,其用于对划分后的各个群落进行特征归纳和油品画像,并对各个群落间的油品差异进行分析。2.如权利要求1所述的油品质量群落分析系统,其特征在于,所述数据获取模块包括:数据获取单元,其用于获取由LIMS系统提供的油品检测数据;数据清洗单元,其用于对所述油品检测数据进行清洗,所述清洗包括删除异常值;数据变换单元,其用于对经过清洗的油品检测数据进行变换,使之成为能够用于建立油品分类模型的油品样本数据,所述变换包括统一量纲和/或数据结构变换。3.如权利要求1所述的油品质量群落分析系统,其特征在于,所述特征筛选模块根据油品样本数据的缺失情况、业务重要性及模型特点筛选出用来建立油品分类模型的油品属性特征。4.如权利要求1所述的油品质量群落分析系统,其特征在于,所述分类划分模块包括:业务划分单元,其用于根据油品来源对油品样本数据进行初步划分;分类监督划分单元,其用于基于筛选出的油品属性特征建立油品分类模型,利用所述油品分类模型对经过业务划分的油品样本数据进行进一步划分。5.如权利要求4所述的油品质量群落分析系统,其特征在于,所述业务划分单元根据油品来源将油品样本数据初步划分为配置油和外采油两种类型。6.如权利要求...

【专利技术属性】
技术研发人员:王维民卢衍波郑斌周金广王守城王乐徐敏倪庆旭
申请(专利权)人:中国石油化工股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1