数据特征生成方法、装置、电子设备以及计算机可读介质制造方法及图纸

技术编号:31306726 阅读:14 留言:0更新日期:2021-12-12 21:24
本申请公开了一种数据特征生成方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:下发特征配置模板,以使用户在配置界面对特征配置模板进行内容配置;接收用户对特征配置模板进行配置的配置内容以及与配置内容对应的至少一组时序数据;基于配置内容,对至少一组时序数据进行处理,生成至少一组数据特征值。该实施方式提高了用户生成特征值的操作的便利性。值的操作的便利性。值的操作的便利性。

【技术实现步骤摘要】
数据特征生成方法、装置、电子设备以及计算机可读介质


[0001]本公开涉及计算机
,具体涉及人工智能
,尤其涉及数据特征生成方法、装置、电子设备以及计算机可读介质。

技术介绍

[0002]在数据挖掘与应用中,利用机器学习的方法解决问题变得非常有效与流行。通常机器学习分析与挖掘的数据,有很大一部分为时间序列数据,即时序数据。时序数据指的是一组按照时间发生先后顺序进行排序的数据序列,这类数据反映了某一事物、现象等随时间的变化状态或程度。时序数据广泛存在于生产生活中,诸如经济学、天气预报等领域,时序数据例如包括:国内生产总值、消费者物价指数、每日的大盘指数、店铺的日营销额、店铺的日订单量、商品的日销售量等。
[0003]在使用机器学习分析时序数据所设计的各种特征中,涉及的操作方法种类较多。比如计算加工数据样本过去设定天数的均值、极值、方差、众数等统计量,针对上述不同操作对应的配置内容较难统一,配置人员需要面对各种各样的配置形式和内容、并准确理解不同参数的具体含义才能正确使用,体验度较差。

技术实现思路

[0004]本公开的实施例提出了数据特征生成方法、装置、电子设备以及计算机可读介质。
[0005]第一方面,本公开的实施例提供了一种数据特征生成方法,该方法包括:下发特征配置模板,以使用户在配置界面对特征配置模板进行内容配置;接收用户对特征配置模板进行配置的配置内容以及与配置内容对应的至少一组时序数据;基于配置内容,对至少一组时序数据进行处理,生成至少一组数据特征值。
[0006]在一些实施例中,上述特征配置模板包括窗口特征组,窗口特征组包括:数据元素、开窗参数以及统计类型;上述接收用户对特征配置模板进行配置的配置内容以及与配置内容对应的至少一组时序数据,包括:接收用户对数据元素、统计类型的配置参量以及开窗参数的配置值;接收与数据元素的配置参量对应的至少一组时序数据;上述基于配置内容,对至少一组时序数据进行处理,生成至少一组数据特征值,包括:基于开窗参数的配置值,对至少一组时序数据进行处理,生成至少一个数据矩阵;基于统计类型的配置参量,对至少一个数据矩阵进行处理,生成至少一组数据特征值。
[0007]在一些实施例中,上述基于开窗参数的配置值,对至少一组时序数据进行处理,生成至少一个数据矩阵,包括:基于开窗参数的配置值,对至少一组时序数据进行窗口化处理,生成至少一个数据矩阵。
[0008]在一些实施例中,上述窗口特征组还包括:场景元素;上述接收用户对特征配置模板进行配置的配置内容,还包括:接收用户对场景元素的配置值;上述基于开窗参数的配置值,对至少一组时序数据进行处理,生成至少一个数据矩阵,包括:基于开窗参数的配置值,对至少一组时序数据进行窗口化处理,生成至少一个窗矩阵;基于场景元素的配置值,对至
少一个窗矩阵进行场景化处理,得到与至少一个窗矩阵对应的至少一个场景矩阵;将至少一个窗矩阵与至少一个场景矩阵进行点乘,生成至少一个数据矩阵。
[0009]在一些实施例中,上述开窗参数包括:开窗方向、开窗大小、开窗基准点;上述基于开窗参数的配置值,对至少一组时序数据进行窗口化处理,生成至少一个窗矩阵,包括:基于基准点的配置值,确定至少一组时序数据的当前观测时间点;在至少一组时序数据的每组时序数据中,以开窗方向的配置值所指示的方向,从当前观测时间点开始选取开窗大小的配置值所指示的时序数据,得到至少一个窗矩阵。
[0010]在一些实施例中,上述窗口特征组至少有两个,上述特征配置模板还包括:至少一个变换特征组,变换特征组包括:特征变换规则;上述接收用户对特征配置模板进行配置的配置内容,还包括:接收用户对特征变换规则的配置参量;上述方法还包括:基于特征变换规则的配置参量,对至少两个窗口特征组对应的数据特征值进行处理,得到变换后的数据特征值。
[0011]在一些实施例中,上述方法还包括:对至少一组时序数据按预设的数据记录格式进行格式处理。
[0012]第二方面,本公开的实施例提供了一种数据特征生成装置,该装置包括:下发单元,被配置成下发特征配置模板,以使用户在配置界面对特征配置模板进行内容配置;配置接收单元,被配置成接收用户对特征配置模板进行配置的配置内容;数据接收单元,被配置成接收与配置内容对应的至少一组时序数据;生成单元,被配置成基于配置内容,对至少一组时序数据进行处理,生成至少一组数据特征值。
[0013]在一些实施例中,上述特征配置模板包括窗口特征组,上述窗口特征组包括:数据元素、开窗参数以及统计类型;上述配置接收单元包括:配置接收模块,被配置成接收用户对数据元素、统计类型的配置参量以及开窗参数的配置值;上述数据接收单元,进一步被配置成接收与数据元素的配置参量对应的至少一组时序数据;上述生成单元包括:矩阵生成模块,被配置成基于开窗参数的配置值,对至少一组时序数据进行处理,生成至少一个数据矩阵;特征生成模块,被配置成基于统计类型的配置参量,对至少一个数据矩阵进行处理,生成至少一组数据特征值。
[0014]在一些实施例中,上述矩阵生成模块,进一步被配置成基于开窗参数的配置值,对至少一组时序数据进行窗口化处理,生成至少一个数据矩阵。
[0015]在一些实施例中,上述窗口特征组还包括:场景元素;上述配置接收单元还包括:场景接收模块,被配置成接收用户对场景元素的配置值;上述生成单元包括:窗口生成模块,被配置成基于开窗参数的配置值,对至少一组时序数据进行窗口化处理,生成至少一个窗矩阵;场景生成模块,被配置成基于场景元素的配置值,对至少一个窗矩阵进行场景化处理,得到与至少一个窗矩阵对应的至少一个场景矩阵;点乘生成模块,被配置成将至少一个窗矩阵与至少一个场景矩阵进行点乘,生成至少一个数据矩阵。
[0016]在一些实施例中,上述开窗参数包括:开窗方向、开窗大小、开窗基准点;上述窗口生成模块包括:基准子模块,被配置成基于基准点的配置值,确定至少一组时序数据的当前观测时间点;配置子模块,被配置成在至少一组时序数据的每组时序数据中,以开窗方向的配置值所指示的方向,从当前观测时间点开始选取开窗大小的配置值所指示的时序数据,得到至少一个窗矩阵。
[0017]在一些实施例中,上述窗口特征组至少有两个,上述特征配置模板还包括:至少一个变换特征组,变换特征组包括:特征变换规则;配置接收单元还包括:参量接收模块,被配置成接收用户对特征变换规则的配置参量;上述装置还包括:变换单元,被配置成基于特征变换规则的配置参量,对至少两个窗口特征组对应的数据特征值进行处理,得到变换后的数据特征值。
[0018]在一些实施例中,上述装置还包括:格式单元,被配置成对至少一组时序数据按预设的数据记录格式进行格式处理。
[0019]第三方面,本公开的实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0020]第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据特征生成方法,所述方法包括:下发特征配置模板,以使用户在配置界面对所述特征配置模板进行内容配置;接收用户对所述特征配置模板进行配置的配置内容以及与所述配置内容对应的至少一组时序数据;基于所述配置内容,对所述至少一组时序数据进行处理,生成至少一组数据特征值。2.根据权利要求1所述的方法,其中,所述特征配置模板包括窗口特征组,所述窗口特征组包括:数据元素、开窗参数以及统计类型;所述接收用户对所述特征配置模板进行配置的配置内容以及与所述配置内容对应的至少一组时序数据,包括:接收用户对所述数据元素、所述统计类型的配置参量以及所述开窗参数的配置值;接收与所述数据元素的配置参量对应的至少一组时序数据;所述基于所述配置内容,对所述至少一组时序数据进行处理,生成至少一组数据特征值,包括:基于所述开窗参数的配置值,对所述至少一组时序数据进行处理,生成至少一个数据矩阵;基于所述统计类型的配置参量,对所述至少一个数据矩阵进行处理,生成至少一组数据特征值。3.根据权利要求2所述的方法,其中,所述基于所述开窗参数的配置值,对所述至少一组时序数据进行处理,生成至少一个数据矩阵,包括:基于所述开窗参数的配置值,对所述至少一组时序数据进行窗口化处理,生成至少一个数据矩阵。4.根据权利要求2所述的方法,其中,所述窗口特征组还包括:场景元素;所述接收用户对所述特征配置模板进行配置的配置内容,还包括:接收用户对所述场景元素的配置值;所述基于所述开窗参数的配置值,对所述至少一组时序数据进行处理,生成至少一个数据矩阵,包括:基于所述开窗参数的配置值,对所述至少一组时序数据进行窗口化处理,生成至少一个窗矩阵;基于所述场景元素的配置值,对所述至少一个窗矩阵进行场景化处理,得到与所述至少一个窗矩阵对应的至少一个场景矩阵;将所述至少一个窗矩阵与所述至少一个场景矩阵进行点乘,生成至少一个数据矩阵。5.根据权利要求3或4所述的方法,其中,所述开窗参数包括:开窗方向、开窗大小、开窗基准点;所述基于所述开窗参数的配置值,对所述至少一组时序数据进行窗口化处理,生成至少一个窗矩阵,包括:基于所述基准点的配置值,确定所述至少一组时序数据的当前观测时间点;在所述至少一组时序数据的每组时序数据中,以所述开窗方向的配置值所指示的方向,从所述当前观...

【专利技术属性】
技术研发人员:向彪韩艾
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1