一种特征提取方法及装置制造方法及图纸

技术编号:23149384 阅读:25 留言:0更新日期:2020-01-18 13:35
本说明书公开了一种特征提取方法及装置,在该方法中确定针对预测模型配置的至少一个特征表达式,针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构,将针对每个特征表达式确定出的各第一树结构进行组合,得到第二树结构,按照预设的解析方式,对该第二树结构进行解析,生成特征提取代码,并通过执行该特征提取代码,对目标数据进行特征提取,得到需要输入到该预测模型的特征数据。由于在确定出预测模型预设的至少一个特征表达式后,根据各特征表达式中包含的各因子,自动得到特征提取代码,这样不仅极大的提高了特征提取代码的生成效率。

A feature extraction method and device

【技术实现步骤摘要】
一种特征提取方法及装置
本说明书涉及计算机领域,尤其涉及一种特征提取方法及装置。
技术介绍
为了能够给用户提供更好的业务体验,各业务平台可以基于用户的历史业务记录、历史浏览记录等信息,分析出用户的业务喜好和习惯,以向用户进行目标推荐。业务平台向用户提供信息推荐服务时,通常是通过设置的多个预测模型来实现的。具体的,业务平台向用户进行信息推荐时,可以随机从多个预测模型中选取一个预测模型,并按照选取出的预测模型所需数据的特征维度,从该用户的属性数据和各可选信息的属性数据中提取特征,将得到的特征数据输入到该预测模型中,得到预测结果。后续业务平台可以基于该预测结果,向该用户进行信息推荐。其中,不同预测模型所需数据的特征维度不尽相同,而设置多个预测模型的主要目的是看哪种特征维度的组合所对应的预测结果更好。为了能够向用户提供更好的信息推荐服务,业务平台需要对预测模型进行进一步地训练,以实现对预测模型的更新。而由于不同预测模型所需数据的特征维度不尽相同,所以在现有技术中,业务平台的工作人员需要预先针对不同的预测模型,设置不同的特征提取代码,通过不同的特征提取代码,业务平台可以从用户的属性数据和各可选信息的属性数据中提取出用于输入到各预测模型中的数据。然而在实际应用中,业务平台的工作人员需要基于实际情况对各预测模型进行更新的同时,也需要对各预测模型所对应的特征提取代码进行调整。而调整特征提取代码将耗费工作人员极大的时间成本和人力成本,从而给工作人员带来了极大的不便。
技术实现思路
本说明书提供一种特征提取方法及装置,以部分的解决现有技术存在的上述问题。本说明书采用下述技术方案:本说明书提供了一种特征提取方法,包括:确定针对预测模型配置的至少一个特征表达式,每个特征表达式中包含有多个因子;针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构;将针对每个特征表达式确定出的各第一树结构进行组合,得到用于生成特征提取代码的第二树结构;按照预设的解析方式,对所述第二树结构进行解析,生成特征提取代码;通过执行所述特征提取代码,对目标数据进行特征提取,得到需要输入所述预测模型的特征数据。可选地,因子包括:算子、元数据、元数据对应的属性数据中的至少一种,所述算子用于从元数据和/或元数据对应的属性数据中确定指定特征维度的数据。可选地,针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构,具体包括:以该特征表达式包含的算子作为父节点,以直接作为所述算子的自变量的因子作为所述父节点的子节点,确定该特征表达式对应的第一树结构。可选地,将针对每个特征表达式确定出的各第一树结构进行组合,得到用于生成特征提取代码的第二树结构,具体包括:按照各特征维度在所述特征数据中预设的排列顺序,将针对每个特征表达式确定出的第一树结构以共同的根节点进行组合,得到所述第二树结构。可选地,按照预设的解析方式,对所述第二树结构进行解析,生成特征提取代码,具体包括:根据预设的各代码生成模板与各因子之间的对应关系,确定所述第二树结构中各节点处的各因子对应的各代码生成模板;根据各代码生成模板,生成所述第二树结构中各节点处的各因子对应的各子特征提取代码;按照所述树结构中各节点之间的父子关系,将所述各子特征提取代码进行组合,生成所述特征提取代码。本说明书提供了一种特征提取的装置,包括:第一确定模块,用于确定针对预测模型配置的至少一个特征表达式,每个特征表达式中包含有多个因子;第二确定模块,用于针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构;树结构模块,用于将针对每个特征表达式确定出的各第一树结构进行组合,得到用于生成特征提取代码的第二树结构;生成模块,用于按照预设的解析方式,对所述第二树结构进行解析,生成特征提取代码;提取模块,用于通过执行所述特征提取代码,对目标数据进行特征提取,得到需要输入所述预测模型的特征数据。可选地,因子包括:算子、元数据、元数据对应的属性数据中的至少一种,所述算子用于从元数据和/或元数据对应的属性数据中确定指定特征维度的数据。可选地,所述第二确定模块具体用于,以该特征表达式包含的算子作为父节点,以直接作为所述算子的自变量的因子作为所述父节点的子节点,确定该特征表达式对应的第一树结构。本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述特征提取方法。本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述特征提取方法。本说明书采用的上述至少一个技术方案能够达到以下有益效果:在本说明书提供的特征提取方法中,可以确定针对预测模型配置的至少一个特征表达式,针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构,将针对每个特征表达式确定出的各第一树结构进行组合,得到用于生成特征提取代码的第二树结构,按照预设的解析方式,对该第二树结构进行解析,生成特征提取代码,并通过执行该特征提取代码,对目标数据进行特征提取,得到需要输入到该预测模型的特征数据。从上述方法中可以看出,由于在确定针对预测模型配置的至少一个特征表达式后,根据各特征表达式中包含的各因子,自动得到特征提取代码,这样不仅极大的提高了特征提取代码的生成效率。并且,即使后续因预测模型的调整需要变更用于提取该预测模型所需特征数据的特征提取代码,也可以在确定出调整后的预测模型所配置的至少一个特征表达式后,自动生成相应的特征提取代码,这样就极大的降低了特征提取代码的维护成本。附图说明此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:图1为本说明书提供的一种特征提取的流程示意图;图2为本说明书提供的确定特征表达式对应第一树结构的示意图;图3为本说明书提供的通过各第一树结构来得到第二树结构的示意图;图4为本说明书提供的一种特征提取的装置示意图;图5为本说明书提供的对应于图1的电子设备示意图。具体实施方式为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书中技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明本文档来自技高网...

【技术保护点】
1.一种特征提取方法,其特征在于,包括:/n确定针对预测模型配置的至少一个特征表达式,每个特征表达式中包含有多个因子;/n针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构;/n将针对每个特征表达式确定出的各第一树结构进行组合,得到用于生成特征提取代码的第二树结构;/n按照预设的解析方式,对所述第二树结构进行解析,生成特征提取代码;/n通过执行所述特征提取代码,对目标数据进行特征提取,得到需要输入所述预测模型的特征数据。/n

【技术特征摘要】
1.一种特征提取方法,其特征在于,包括:
确定针对预测模型配置的至少一个特征表达式,每个特征表达式中包含有多个因子;
针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构;
将针对每个特征表达式确定出的各第一树结构进行组合,得到用于生成特征提取代码的第二树结构;
按照预设的解析方式,对所述第二树结构进行解析,生成特征提取代码;
通过执行所述特征提取代码,对目标数据进行特征提取,得到需要输入所述预测模型的特征数据。


2.如权利要求1所述的特征提取方法,其特征在于,因子包括:算子、元数据、元数据对应的属性数据中的至少一种,所述算子用于从元数据和/或元数据对应的属性数据中确定指定特征维度的数据。


3.如权利要求2所述的特征提取方法,其特征在于,针对每个特征表达式,根据该特征表达式中各因子之间的关联关系,在预设树结构的各节点处添加各因子,确定该特征表达式对应的第一树结构,具体包括:
以该特征表达式包含的算子作为父节点,以直接作为所述算子的自变量的因子作为所述父节点的子节点,确定该特征表达式对应的第一树结构。


4.如权利要求3所述的特征提取方法,其特征在于,将针对每个特征表达式确定出的各第一树结构进行组合,得到用于生成特征提取代码的第二树结构,具体包括:
按照各特征维度在所述特征数据中预设的排列顺序,将针对每个特征表达式确定出的第一树结构以共同的根节点进行组合,得到所述第二树结构。


5.如权利要求4所述的特征提取方法,其特征在于,按照预设的解析方式,对所述第二树结构进行解析,生成特征提取代码,具体包括:
根据预设的各代码生成模板与各因子之间的对应关系,确定所述第二树结构中各节点处的各因...

【专利技术属性】
技术研发人员:朱纪乐张立文程佳柳明海张涛杜宇亮
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1