网络流量预测数据预处理阶段的参数最优化方法及系统技术方案

技术编号：30552531 阅读：81 留言：0更新日期：2021-10-30 13:33

本发明专利技术属于数据处理技术领域，公开了一种网络流量预测数据预处理阶段的参数最优化方法及系统，网络流量预测数据预处理阶段的参数最优化方法包括：对数据集进行改进策略上的Q

全部详细技术资料下载

【技术实现步骤摘要】
网络流量预测数据预处理阶段的参数最优化方法及系统

[0001]本专利技术属于数据处理
，尤其涉及一种网络流量预测数据预处理阶段的参数最优化方法及系统。

技术介绍

[0002]目前，21世纪的今天，正处于科技创新高速发展的阶段，科技创新是第一生产力。网络科技的飞速发展，带动了很多的新兴产业和网络产物，自媒体、直播等网络科技的发展，尽管带来了很多的就业岗位，但也带来了巨大的网络流量使用的需求。因此，需要一种合理的对网络流量资源的使用进行科学信息化的规划，保障在安全高效使用的情况保证用户需求，从而保证更高效的社会经济的持续发展。要想做到网络流量负荷系统的正常运行，首要的前提条件就是加强关于网络流量预测的相关工作，特别是在预测前的工作，即对数据的科学预处理模块，这在网络流量市场的发展过程中显得十分必要。
[0003]在网络流量预测中，因为数据采集时的操作不规范、采集设备故障、数据系统升级等原因，导致数据中存在大量的空值、异常值的情况。数据质量较差对数据预处理构成了严重的挑战。在数据清洗阶段，既不能一味的去除所有的包含空值的数据行，也不能放任含有大量空值的数据行进入数据增强阶段或者模型训练阶段。在数据清洗流程中，通常使用有效数据的非空值率参数作为平衡数据质量的关键指标之一。该参数通过控制有效数据中包含的非空值数量与总量数量之间的比例，决定哪些数据行将被保留并进入下一个阶段，哪些数据行将被剔除出数据集。当非空值率处于最优状态下时，数据清洗将可以在保留尽可能多数据的情况下，提升数据集总体的非空值率，即在保留了尽可能多...

【技术保护点】

【技术特征摘要】
1.一种网络流量预测数据预处理阶段的参数最优化方法，其特征在于，应用于数据信息处理终端，所述网络流量预测数据预处理阶段的参数最优化方法包括以下步骤：步骤一，对数据集进行改进策略上的Q
‑
Learning强化学习预处理；步骤二，进行基于流程压缩的快速估值网络模型的构建；步骤三，进行基于混合精度的模型训练；步骤四，进行基于改进Q
‑
Learning的最优化参数搜索。2.如权利要求1所述的网络流量预测数据预处理阶段的参数最优化方法，其特征在于，步骤一中，所述数据预处理，还包括：通过流属性统计特征的识别分类方法的核心思想，利用数据挖掘和机器学习领域的统计决策、分类和聚类的方法，对原始网络流量数据进行流属性统计特征分析，选取合适的机器学习算法，对数据进行分类提取，通过数据包层面特征、数据流层面特征、连接层面特征三大类找出相关流的数据特征，在数据端口出区分开汇聚层和接入层数据。3.如权利要求1所述的网络流量预测数据预处理阶段的参数最优化方法，其特征在于，步骤二中，所述基于流程压缩的快速估值网络模型的构建，包括：提出快速估值网络，先用快速估值网络模型进行参数寻找，通过实验设计选择新的策略，每过5％进行一次迭代，省略对数据的零值和异常值的处理操作，直接进行十代的迭代处理，当找到最优参数后，再进行对数据的清洗和增强处理，且选取epoch＝10；通过Q
‑
Learning策略中的reward指标对网络进行反馈，学习期望价值，从当前一步到所有后续步骤，总期望获取最大价值Q值、Value；Action决定Q值函数中每一个state下的最佳策略，在每个state下，选择Q值最高的Action，且网络不依赖环境模型；当前Action获得Reward，加下一步可获得最大期望价值，当前状态行动奖励，加下一状态行动最大期望价值；学习速率决定新获取样本信息覆盖率前掌握到信息比率，通常设定较小值；Q
‑
Learning初始值Q，通过定义比较高初始值，鼓励模型多探索；不同数据处理在训练时间的对比中，纵坐标的SMAPE值是对称平均绝对百分比误差，是基于百分比或者相对误差的一种精确性度量，用于衡量网络模型好坏的指标，SMAPE值越低越好，SMAPE是针对MAPE的问题的修正指标，计算方式如以下公式所示：其中，A
t
是真实值，F
t
是预测值。4.如权利要求1所述的网络流量预测数据预处理阶段的参数最优化方法，其特征在于，步骤三中，所述基于混合精度的模型训练，包括：预测模型采用半精度的数据；其中，所述双精度浮点数、单精度浮点数和半精度浮点数的区别如下：float16半精度浮点数，包括1个符号位，5个指数位，10个尾数位；float32单精度浮点数，包括1个符号位，8个指数位，23个尾数位；float64双精度浮点数，包括1个符号位，11个指数位，52个尾数位。5.如权利要求1所述的网络流量预测数据预处理阶段的参数最优化方法，其特征在于，
步骤四中，所述基于改进Q
‑
Le...

【专利技术属性】
技术研发人员：王春枝，文晓东，严灵毓，苏军，杨杰，詹军，
申请(专利权)人：武汉烽火技术服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人