【技术实现步骤摘要】
大数据分析模型算法选型方法、装置、电子设备及介质
本专利技术实施例涉及大数据
,尤其涉及一种大数据分析模型算法选型方法、装置、电子设备及介质。
技术介绍
大数据技术是目前国内外各行各业都在研究的一个热点项目。随着全球范围内大数据改变带来的技术挑战,我国也越来越重视大数据技术的实际运用。近年来,随着国家电网管理重点从集中、统一向精细、高效的转变,结合“互联网+”时代背景下信息技术的高速发展和各种数字化技术的广泛应用,国家电网与数字化技术的发展融合以成为趋势。大数据实现了对数据的集成、分析和处理,支持着国网企业相关业务的海量数据检索。大数据技术基于大量高维多变数据的视角,直接鲜明地展现出国网的统筹设计,将会更好的支撑电网的规划和发展。大数据在电网中的应用蕴藏着巨大的商业价值和社会价值,挖掘电力大数据的价值面临巨大的机遇。智能电网基于数据和能源的同步传输,促进能源与信息技术的深度融合,逐渐形成以能源、数据为运行体系支撑下的坚强可靠、清洁环保、友好互动的能源管理网络。大数据电网的挖掘很好地实现了智能用电管理,大幅度提升 ...
【技术保护点】
1.一种大数据分析模型算法选型方法,其特征在于,包括:/n根据电网业务数据的应用场景和数据特点匹配对应的模型类别;/n基于所述模型类别对应的至少两个分析模型分别处理所述电网业务数据,得到处理结果;/n根据所述处理结果和所述模型类别对应的评价参数对所述分析模型进行评价,基于评价结果进行模型推荐。/n
【技术特征摘要】
1.一种大数据分析模型算法选型方法,其特征在于,包括:
根据电网业务数据的应用场景和数据特点匹配对应的模型类别;
基于所述模型类别对应的至少两个分析模型分别处理所述电网业务数据,得到处理结果;
根据所述处理结果和所述模型类别对应的评价参数对所述分析模型进行评价,基于评价结果进行模型推荐。
2.根据权利要求1所述的方法,其特征在于,在根据电网业务数据的应用场景和数据特点匹配对应的模型类别之前,还包括:
建立分析模型与模型类别的关联关系,其中,所述模型类别包括关联规则模型、分类模型、回归模型和聚类模型;
建立电网业务数据的应用场景和数据特点与模型类别之间的映射关系;
通过模型库存储分析模型、所述分析模型与模型类别的关联关系、以及所述电网业务数据的应用场景和数据特点与模型类别之间的映射关系。
3.根据权利要求2所述的方法,其特征在于,包括采用如下方式建立电网业务数据的应用场景和数据特点与模型类别之间的映射关系:
采用关联规则模型分析挖掘电网业务数据之间的关系以及联系;
采用分类模型或回归模型处理具有标签的电网业务数据以及监督场景;
采用聚类模型处理没有标签但需要类别划分的电网业务数据。
4.根据权利要求2所述的方法,其特征在于,在根据处理结果和所述模型类别对应的评价参数对所述分析模型进行评价之前,还包括:
预先设置所述模型类别对应的评价参数,其中,所述关联规则模型对应的评价参数包括支持度和置信度,所述分类模型的评价参数包括查准率、查全率、F-score、正确率和ROC曲线,所述回归模型的评价参数包括误差平方和决定系数,所述聚类模型的评价参数包括估计聚类趋势、确定数据集中的簇数和测定聚类质量。
5.根据权利要求2所述的方法,其特征在于,根据电网业务数据的应用场景和数据特点匹...
【专利技术属性】
技术研发人员:王宏刚,纪鑫,刘识,赵晓龙,余婷,刘文,李君婷,赵宇亮,张帆,
申请(专利权)人:国家电网有限公司大数据中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。