当前位置: 首页 > 专利查询>中国电力工程顾问集团华东电力设计院有限公司专利>正文

时间特征的处理方法、处理装置制造方法及图纸

技术编号：32165403 阅读：13 留言：0更新日期：2022-02-08 15:19

本发明专利技术提供一种时间特征的处理方法、处理装置，所述方法包括：将训练数据集中的时间特征转化为十进制的数值型时间特征后，采用聚类算法对训练数据集进行聚类，并输出聚类结果；采用至少一种用于分类的机器学习算法对时间特征和聚类结果进行机器学习；采用交叉验证数据集验证机器学习算法输出结果的准确性，直到训练出符合要求的分类模型；将测试数据集中的时间特征转化为十进制的数值型时间特征后，输入分类模型，以使分类模型输出分类结果。本发明专利技术将时间特征数据转化成十进制的数值型数据后再进行学习，可以解决因其形式特殊而造成的问题，且从训练数据集和测试数据集双向对于时间特征进行学习，可以显著提高学习模型的准确程度。程度。程度。

全部详细技术资料下载

【技术实现步骤摘要】
时间特征的处理方法、处理装置

[0001]本专利技术涉及数据处理
，具体涉及一种时间特征的处理方法、一种时间特征的处理装置。

技术介绍

[0002]目前，在工业领域，具有许多采用机器学习或者深度学习算法根据输入特征数据对相应的参数进行预测的场景，例如，在风光储发电站的场景中，最常采用并且研究最多的为采用机器学习或者深度学习算法根据输入特征数据对于电站的出力进行预测。
[0003]然而，在设计机器学习和深度学习算法时，许多场景的输入特征为时间特征，例如储能电站的输入特征大部分为气象特征，如风速、辐照度、气温、气压、湿度等，这些特征的值本身就具有较大的波动性并且相互之间存在耦合关系，在这种情况下，唯一绝对准确并且量化的特征为数据的采集时间，其能够反映其他各个特征和所需要的预测值随时间的变化情况。
[0004]然而，在数据类型中，时间特征是非常特殊的一种类型，虽然其中隐含的信息较多，但是时间特征中日期的构成形式为年、月、日，时间的构成方式为时、分、秒，都不是其他数值型数据采用的十进制方式。在这种情况下，如果直接将时间特征作为特征输入机器学习模型和深度学习模型进行训练，会造成模型无法判断其与其他采用十进制数值特征之间的差异，从而使模型训练失败或者大幅度降低模型的预测准确性。

技术实现思路

[0005]为解决上述技术问题，本专利技术的第一个目的在于提出一种时间特征的处理方法，将时间特征数据转化成十进制数值型数据后再进行学习，可以解决因其形式特殊而造成的问题，且采用机器学习模型的方式从训练数...

【技术保护点】

【技术特征摘要】
1.一种时间特征的处理方法，其特征在于，包括以下步骤：获取数据集，所述数据集包括时间特征和与所述时间特征对应的参数预测值，所述时间特征包括日期和时刻；将所述数据集分为训练数据集、交叉验证数据集和测试数据集；将所述训练数据集中的时间特征转化为十进制数值型时间特征后，采用聚类算法对所述训练数据集进行聚类，并输出聚类结果；采用至少一种用于分类的机器学习算法对所述时间特征和所述聚类结果进行机器学习；采用所述交叉验证数据集验证所述机器学习算法输出结果的准确性，并根据所述准确性对所述机器学习算法的参数进行调整，直到机器学习算法训练出符合要求的分类模型；将所述测试数据集中的时间特征转化为十进制数值型时间特征后，输入所述分类模型，以使所述分类模型输出分类结果。2.根据权利要求1所述的时间特征的处理方法，其特征在于，将所述数据集分为训练数据集、交叉验证数据集和测试数据集，具体包括：将所述数据集的60％作为训练数据集、20％作为交叉验证数据集、20％作为测试数据集。3.根据权利要求1所述的时间特征的处理方法，其特征在于，所述聚类算法包括K均值聚类算法。4.根据权利要求1所述的时间特征的处理方法，其特征在于，所述用于分类的机器学习算法包括三个。5.根据权利要求4所述的时间特征的处理方法，其特征在于，所述用于分类的机器学习算法包括：支持向量机、GBDT分类和逻辑回归。6.一种时间特征的处理装置，其特征在于，包括：获取模块，所...

【专利技术属性】
技术研发人员：朱祺，杨鹏，
申请(专利权)人：中国电力工程顾问集团华东电力设计院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人