预测模型的训练及预测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37765856 阅读:12 留言:0更新日期:2023-06-06 13:25
本公开提供了一种预测模型的训练及预测方法、装置、电子设备及存储介质,涉及智能搜索、深度学习以及人工智能等技术领域。具体实现方案为:获取多个业务领域的日志数据;基于所述多个业务领域的日志数据,构建特征信息表;所述特征信息表中包括所述多个业务领域的特征以及所述特征对应的内容数据;基于所述特征信息表中各个所述业务领域的特征以及所述特征对应的内容数据,获取参与模型训练的目标特征;基于所述目标特征和所述特征信息表,对预测模型进行多目标的训练。本公开的技术,能够有效地提高多个业务领域的模型管理和维护效率。效率。效率。

【技术实现步骤摘要】
预测模型的训练及预测方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,具体涉及智能搜索、深度学习以及人工智能等
,尤其涉及一种预测模型的训练及预测方法、装置、电子设备及存储介质。

技术介绍

[0002]为了探索和构建用户的购买交易心智,在服务和商品的各垂类的业务领域中持续深耕发力,可以深入研究各垂类的业务领域的核心目标,以进行更加精准地分析与探索。
[0003]由于每个业务领域存在其产品或者业务的独特性,不同的业务领域分别由独立团队分别建设和效果优化,每个业务领域独立构建“展



转”等用户行为日志数据,然后独立训练该业务领域的核心目标的深度神经网络(Deep Neural Network;DNN)模型。

技术实现思路

[0004]本公开提供了一种预测模型的训练及预测方法、装置、电子设备及存储介质。
[0005]根据本公开的一方面,提供了一种预测模型的训练方法,包括:
[0006]获取多个业务领域的日志数据;
[0007]基于所述多个业务领域的日志数据,构建特征信息表;所述特征信息表中包括所述多个业务领域的特征以及所述特征对应的内容数据;
[0008]基于所述特征信息表中各个所述业务领域的特征以及所述特征对应的内容数据,获取参与模型训练的目标特征;
[0009]基于所述目标特征和所述特征信息表,对预测模型进行多目标的训练。
[0010]根据本公开的另一方面,提供了一种目标预测方法,包括:
[0011]响应于业务请求,从所述数据管理平台中获取多条业务信息;
[0012]对于各条所述业务信息,基于对应的所述业务信息和预设的目标特征,获取所述预设的目标特征对应的内容数据;
[0013]基于所述预设的目标特征的内容数据和预先训练的预测模型,获取所述预测模型预测的多个目标的信息。
[0014]根据本公开的再一方面,提供了一种预测模型的训练装置,包括:
[0015]日志获取模块,用于获取多个业务领域的日志数据;
[0016]构建模块,用于基于所述多个业务领域的日志数据,构建特征信息表;所述特征信息表中包括所述多个业务领域的特征以及所述特征对应的内容数据;
[0017]特征获取模块,用于基于所述特征信息表中各个所述业务领域的特征以及所述特征对应的内容数据,获取参与模型训练的目标特征;
[0018]训练模块,用于基于所述目标特征和所述特征信息表,对预测模型进行多目标的训练。
[0019]根据本公开的又一方面,提供了一种目标预测装置,包括:
[0020]业务信息获取模块,用于响应于业务请求,从所述数据管理平台中获取多条业务
信息;
[0021]特征数据获取模块,用于对于各条所述业务信息,基于对应的所述业务信息和预设的目标特征,获取所述预设的目标特征对应的内容数据;
[0022]目标预测模块,用于基于所述预设的目标特征的内容数据和预先训练的预测模型,获取所述预测模型预测的多个目标的信息。
[0023]根据本公开的再另一方面,提供了一种电子设备,包括:
[0024]至少一个处理器;以及
[0025]与所述至少一个处理器通信连接的存储器;其中,
[0026]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
[0027]根据本公开的再又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。
[0028]根据本公开的又另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
[0029]根据本公开的技术,能够有效地提高多个业务领域的模型管理和维护效率。
[0030]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0031]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0032]图1是根据本公开第一实施例的示意图;
[0033]图2是根据本公开第二实施例的示意图;
[0034]图3是根据本公开第三施例的示意图;
[0035]图4是根据本公开第四施例的示意图;
[0036]图5是根据本公开第五施例的示意图;
[0037]图6是图5所示实施例中构建的特征信息表的部分片段的示意图;
[0038]图7是本公开实施例提供的预测模型中的DNN塔的结构示意图;
[0039]图8是根据本公开第六施例的示意图;
[0040]图9是是根据本公开第七施例的示意图;
[0041]图10是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
[0042]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0043]显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开
中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
[0044]需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。
[0045]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0046]现有技术中,需要针对于每个业务领域中的每个核心目标,都单独训练一个相应的模型。若同一个商家平台,包括多个垂类的业务领域,且也需要多个核心目标的情况下,需要维护多个模型,长期迭代特征工作量非常大,导致模型管理和维护效率非常低。
[0047]图1是根据本公开第一实施例的示意图;如图1所示,本实施例提供一种预测模型的训练方法,具体可以包括如下步骤:
[0048]S101、获取多个业务领域的日志数据;
[0049]本实施例的多个业务领域包括多个垂类的业务或者场景的领域。例如,在某个商户平台中,可以包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测模型的训练方法,包括:获取多个业务领域的日志数据;基于所述多个业务领域的日志数据,构建特征信息表;所述特征信息表中包括所述多个业务领域的特征以及所述特征对应的内容数据;基于所述特征信息表中各个所述业务领域的特征以及所述特征对应的内容数据,获取参与模型训练的目标特征;基于所述目标特征和所述特征信息表,对预测模型进行多目标的训练。2.根据权利要求1所述的方法,其中,基于所述多个业务领域的日志数据,构建特征信息表,包括:基于所述多个业务领域的日志数据,挖掘各所述业务领域的特征以及所述特征对应的内容数据;将各所述业务领域的特征以及所述特征对应的内容数据进行聚合,得到所述特征信息表。3.根据权利要求1所述的方法,其中,基于所述特征信息表中各个所述业务领域的特征以及所述特征对应的内容数据,获取参与模型训练的目标特征,包括:基于所述特征信息表中各所述业务领域的特征以及所述特征对应的内容数据,抽取至少两个所述业务领域共用的至少一个共用特征;基于所述至少一个共用特征和各所述业务领域的至少一个特有特征,获取参与模型训练的所述目标特征;各所述业务领域的特有特征为所述特征信息表中所述业务领域对应的所有特征中所述共用特征之外的特征。4.根据权利要求3所述的方法,其中,基于所述至少一个共用特征和各所述业务领域的至少一个特有特征,获取参与模型训练的所述目标特征,包括:基于所述至少一个共用特征,获取参与模型训练的所述目标特征;基于各所述业务领域的至少一个特有特征,获取参与模型训练的所述目标特征。5.根据权利要求4所述的方法,其中,基于所述至少一个共用特征,获取参与模型训练的所述目标特征,包括:通过对各所述共用特征进行评估,从所述至少一个共用特征中,筛选参与模型训练的所述目标特征。6.根据权利要求4所述的方法,其中,基于所述至少一个共用特征,获取参与模型训练的所述目标特征,包括:基于所述至少一个共用特征,按照预设的特征生成方式,生成至少一个第一类特征;通过对各所述共用特征和各所述第一类特征分别进行评估,从所述至少一个共用特征和所述至少一个第一类特征中,筛选参与模型训练的所述目标特征。7.根据权利要求4所述的方法,其中,基于各所述业务领域的至少一个特有特征,获取参与模型训练的所述目标特征,包括:通过对各所述业务领域的所述至少一个特有特征分别进行评估,从各所述业务领域的所述至少一个特有特征中,筛选参与模型训练的所述目标特征。8.根据权利要求4所述的方法,其中,基于各所述业务领域的至少一个特有特征,获取参与模型训练的所述目标特征,包括:
基于各所述业务领域的至少一个特有特征,按照预设的特征生成方式,生成各所述业务领域的至少一个第二类特征;通过对各所述业务领域的所述至少一个特有特征和所述至少一个第二类特征分别进行评估,从各所述业务领域的所述至少一个特有特征和所述至少一个第二类特征中,筛选参与模型训练的所述目标特征。9.根据权利要求1

8任一所述的方法,其中,基于所述目标特征和所述特征信息表,对预测模型进行多任务目标的训练,包括:基于所述目标特征,从所述特征信息表中获取多条训练数据;各条所述训练数据中包括所述目标特征的内容数据;采用所述多条训练数据,对所述预测模型进行多目标的训练。10.根据权利要求1

8任一所述的方法,其中,基于所述多个业务领域的日志数据,构建特征信息表之后,基于所述特征信息表中各个所述业务领域的特征以及所述特征对应的内容数据,获取参与模型训练的目标特征之前,所述方法还包括:对所述特征信息表进行统一的格式转换。11.一种目标预测方法,包括:响应于业务请求,从数据管理平台中获取多条业务信息;对于各条所述业务信息,基于对应的所述业务信息和预设的目标特征,获取所述目标特征对应的内容数据;基于所述目标特征对应的内容数据和预先训练的预测模型,获取所述预测模型预测的多个目标的信息。12.根据权利要求11所述的方法,其中,基于所述预设的目标特征的内容数据和预先训练的预测模型,获取所述预测模型预测的多个目标的信息之后,所述方法还包括:对于各条所述业务信息,从对应的所述多个目标的信息中获取指定目标的信息;基于各条所述业务信息的所述指定目标的信息,对所述多个业务信息进行排序;按照所述排序的结果,展示所述多个业务信息。13.根据权利要求11所述的方法,其中,所述业务请求包括所述预测模型可以适用的多个业务领域中任一业务领域的业务请求;所述多个目标包括点击率、转化率、深度转化率、展现转换率以及点击转化率中的至少两个。14.一种预测模型的训练装置,包括:日志获取模块,用于获取多个业务领域的日志数据;构建模块,用于基于所述多个业务领域的日志数据,构建特征信息表...

【专利技术属性】
技术研发人员:陈国梁陈正亮刘伟
申请(专利权)人:百度中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1