【技术实现步骤摘要】
自动时间序列回归方法和装置
本专利技术涉及机器学习
,具体涉及一种自动时间序列回归方法、一种自动时间序列回归装置、一种计算机设备、一种非临时性计算机可读存储介质和一种计算机程序产品。
技术介绍
随着数据时代的来临,数据量正在以指数级的方式增长,而这样的增长速度迫使科学界面临着各种各样的挑战,在这些数据中有一种重要的数据表现形式是时间序列,时间序列是以时间为主自变量的函数,生活中有很多序列数据都属于时间序列的范畴,比如股票指数、心脑电图,甚至语音信号、草原某地的风速等等,都是有其内在特征的变化。时间序列回归就是在大量看起来随机和无序的数据中所蕴含的确定和有序的规律性。这种规律的思想并非是形而上的,在不同的时段、不同的地点甚至更改其中一个很小的因素都会产生不同的变化,因此这种规律是动态的、有限的。时间序列关系型数据在经济金融、保险、在线广告、推荐系统、医疗等应用场景中非常常见,人们往往需要利用这样的数据去构建机器学习模型,并应用机器学习模型提升对应业务的效果。时间序列数据是机器学习解决行业场景,尤其是大数据场景的最 ...
【技术保护点】
1.一种自动时间序列回归方法,其特征在于,包括以下步骤:/n获取时序数据集,并对所述时序数据集进行预处理;/n对预处理后的时序数据集进行自动时序特征工程处理和数据采样;/n建立不同类型的机器学习模型;/n根据预处理、自动时序特征工程处理和数据采样后的时序数据集计算基于时间滑窗的动态权重,以对不同类型的机器学习模型进行融合。/n
【技术特征摘要】
1.一种自动时间序列回归方法,其特征在于,包括以下步骤:
获取时序数据集,并对所述时序数据集进行预处理;
对预处理后的时序数据集进行自动时序特征工程处理和数据采样;
建立不同类型的机器学习模型;
根据预处理、自动时序特征工程处理和数据采样后的时序数据集计算基于时间滑窗的动态权重,以对不同类型的机器学习模型进行融合。
2.根据权利要求1所述的自动时间序列回归方法,其特征在于,对所述时序数据集进行预处理,包括:
对所述时序数据集中的异常点进行平滑处理。
3.根据权利要求2所述的自动时间序列回归方法,其特征在于,对预处理后的时序数据集进行自动时序特征工程处理所得到的特征包括基于时间滑窗的target特征、基于时间滑窗的target统计特征、基于时间滑窗的target趋势特征、基于时间滑窗的重要原始特征、基于时间滑窗的统计特征。
4.根据权利要求3所述的自动时间序列回归方法,其特征在于,对预处理后的时序数据集进行数据采样,包括:
对所述时序数据集中的ID进行随机采样,其中,对于不同大小的数据量使用不同的采样比率。
5.根据权利要求4所述的自动时间序列回归方法,其特征在于,不同类型的机器学习模型包括线性回归和LightGBM模型。
6.根据权利要求5所述的自动时间序列回归方法,其特征在于,根据预处理、自动时序特征工程处理和数据采样后的时序数据集计算基于时间滑窗的动态权重,以对不同类型的机器学...
【专利技术属性】
技术研发人员:陈海波,罗志鹏,王锦,姚灿美,
申请(专利权)人:深延科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。