内容处理系统、方法、装置、设备及介质制造方法及图纸

技术编号:28498343 阅读:20 留言:0更新日期:2021-05-19 22:36
本申请公开了一种内容处理系统、方法、装置、设备及介质,涉及计算机技术领域,用于提高内容处理的准确性。该内容处理系统包括:包括计算层、存储层和服务层,其中:计算层,用于对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对各种物料分别进行相应的特征工程处理,获得各种特征,其中,各种特征均分别包括实时特征和样本特征;存储层,用于存储各种物料和各种特征;服务层,用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将目标实时特征输入已训练的目标模型,获得内容处理结果,其中,已训练的目标模型是根据与目标实时特征对应种类相同的目标样本特征进行训练得到的。本特征进行训练得到的。本特征进行训练得到的。

【技术实现步骤摘要】
内容处理系统、方法、装置、设备及介质


[0001]本申请涉及计算机
,尤其涉及人工智能
,提供一种内容处理系统、方法、装置、设备及介质。

技术介绍

[0002]随着计算机技术的不断发展,逐渐出现了各种内容处理平台,这些内容处理平台可以为用户提供相应的内容服务,例如为用户推荐文章、为用户推荐视频等。
[0003]目前,大多内容处理平台是会借助模型实现内容服务处理任务。在使用模型之前,大多需要对模型进行离线训练,即提前根据相应的样本数据训练模型,获得已训练的模型之后,直接将已训练的模型应用于内容处理平台,以实现内容服务处理任务。但这种方式无法保证在模型训练阶段所使用的样本数据和模型使用阶段中所使用的输入数据具有相同的处理逻辑,进而导致模型的使用效果不佳,降低了模型输出的内容处理结果的准确性。

技术实现思路

[0004]本申请实施例提供一种内容处理系统、方法、装置、设备及介质,用于提高内容处理结果的准确性。
[0005]一方面,本申请一实施例提供了一种内容处理系统,包括计算层、存储层和服务层,其中:
[0006]所述计算层,用于对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对所述各种物料分别进行相应的特征工程处理,获得各种特征,其中,所述各种特征均分别包括实时特征和样本特征,所述实时特征是根据当前时间段的物料生成的,所述样本特征是根据所述当前时间段之前的物料生成的;
[0007]所述存储层,用于存储所述各种物料和所述各种特征;
[0008]所述服务层,用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将所述目标实时特征输入已训练的目标模型,获得内容处理结果,其中,所述已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。
[0009]一方面,本申请一实施例提供了一种内容处理方法,包括:
[0010]对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对所述各种物料分别进行相应的特征工程处理,获得各种特征,其中,所述各种特征均分别包括实时特征和样本特征,所述实时特征是根据当前时间段的物料生成的,所述样本特征是根据所述当前时间段之前的物料生成的;
[0011]存储所述各种物料和所述各种特征;
[0012]根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将所述目标实时特征输入已训练的目标模型,获得内容处理结果,其中,所述已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。
[0013]在一种可能的实施例中,所述根据每一内容处理任务所需的特征种类,获得对应
的目标实时特征,包括:
[0014]从预存的配置信息中,确定与每一内容服务任务对应的特征种类,其中,所述配置信息包括每一内容服务任务所需的特征种类;
[0015]根据每一内容服务任务对应的特征种类,获取对应的目标实时特征。
[0016]在一种可能的实施例中,所述配置信息还包括每一内容服务任务所需的物料的种类;所述根据每一内容服务任务对应的特征种类,获取对应的目标实时特征,包括:
[0017]根据每一内容服务任务对应的特征种类,从所述各种特征中获取对应的目标实时特征;
[0018]若确定所述各种特征中不存在与每一内容处理任务对应的实时特征,则根据每一内容服务任务所需的物料的种类,从所述存储层中获取对应的目标物料;
[0019]对所述目标物料进行特征工程处理,获得目标实时特征。
[0020]在一种可能的实施例中,所述对所述目标物料进行特征工程处理,获得目标实时特征之后,所述方法还包括:存储所述目标实时特征。
[0021]在一种可能的实施例中,所述对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,包括:
[0022]调用与所述内容数据和用户数据中每种数据对应的物料计算包,对相应的数据进行物料抽取,获得各种物料;
[0023]所述对所述各种物料分别进行相应的特征工程处理,获得各种特征,包括:
[0024]调用与所述各种物料中每种物料对应的特征算子包,对相应的物料进行特征工程处理,获得各种特征。
[0025]在一种可能的实施例中,所述调用与所述内容数据和用户数据中每种数据对应的物料计算包,对相应的数据进行物料抽取,获得各种物料,包括:
[0026]根据所述内容数据对应的物料计算包,对所述内容数据进行物料抽取,获得内容物料;以及,根据所述用户数据对应的物料计算包,对所述用户数据进行物料抽取,获得用户物料;
[0027]所述调用与所述各种物料中每种物料对应的特征算子包,对相应的物料进行特征工程处理,获得各种特征,包括:
[0028]根据所述内容物料对应的特征算子包,对所述内容物料进行特征工程处理,获得内容特征;以及,根据所述用户物料对应的特征算子包,对所述用户物料进行特征工程处理,获得用户特征。
[0029]在一种可能的实施例中,所述方法还包括:
[0030]从消息队列中获取更新后的物料计算包,并加载所述更新后的物料计算包;
[0031]从消息队列中获取更新后的特征算子包,并加载所述更新后的特征算子包。
[0032]在一种可能的实施例中,所述方法还包括:
[0033]从预存的已训练的至少一种模型中,确定处理每一内容处理任务所需的目标模型。
[0034]在一种可能的实施例中,所述方法还包括:将所述各种特征中的各种样本特征加入消息队列,以使训练设备执行如下操作:
[0035]获取所述各种样本特征,并根据训练至少一种模型中每种模型所需的特征种类,
获取相应的样本特征,以及根据获取的样本特征,对相应的模型进行训练,获得已训练的至少一种模型;
[0036]从所述训练设备获得所述已训练的至少一种模型。
[0037]一方面,本申请一实施例提供了一种内容处理装置,包括:
[0038]物料处理模块,用于对获取的内容数据和用户数据分别进行物料抽取,获得各种物料;
[0039]特征处理模块,用于对所述各种物料分别进行相应的特征工程处理,获得各种特征,其中,所述各种特征均分别包括实时特征和样本特征,所述实时特征是根据当前时间段的物料生成的,所述样本特征是根据所述当前时间段之前的物料生成的;
[0040]存储模块,用于存储所述各种物料和所述各种特征;
[0041]内容处理模块,用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将所述目标实时特征输入已训练的目标模型,获得内容处理结果,其中,所述已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。
[0042]一方面,本申请一实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述任一种方法的步骤。
[0043]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容处理系统,其特征在于,包括计算层、存储层和服务层,其中:所述计算层,用于对获取的内容数据和用户数据分别进行物料抽取,获得各种物料,并对所述各种物料分别进行相应的特征工程处理,获得各种特征,其中,所述各种特征均分别包括实时特征和样本特征,所述实时特征是根据当前时间段的物料生成的,所述样本特征是根据所述当前时间段之前的物料生成的;所述存储层,用于存储所述各种物料和所述各种特征;所述服务层,用于根据每一内容处理任务所需的特征种类,获得对应的目标实时特征,并将所述目标实时特征输入已训练的目标模型,获得内容处理结果,其中,所述已训练的目标模型是根据与所述目标实时特征对应种类相同的目标样本特征进行训练得到的。2.如权利要求1所述的系统,其特征在于,所述服务层具体用于:从预存的配置信息中,确定与每一内容服务任务对应的特征种类,其中,所述配置信息包括每一内容服务任务所需的特征种类;根据每一内容服务任务对应的特征种类,获取对应的目标实时特征。3.如权利要求2所述的系统,其特征在于,所述配置信息还包括每一内容服务任务所需的物料的种类;所述服务层具体用于:根据每一内容服务任务对应的特征种类,从所述存储层获取对应的目标实时特征;若确定所述存储层中不存在与每一内容处理任务对应的实时特征,则根据每一内容服务任务所需的物料的种类,从所述存储层中获取对应的目标物料;对所述目标物料进行特征工程处理,获得目标实时特征。4.如权利要求3所述的系统,其特征在于,所述存储层还用于:从所述服务层获取所述目标实时特征,并存储所述目标实时特征。5.如权利要求1所述的系统,其特征在于,所述计算层具体用于:调用与所述内容数据和用户数据中每种数据对应的物料计算包,对相应的数据进行物料抽取,获得各种物料;调用与所述各种物料中每种物料对应的特征算子包,对相应的物料进行特征工程处理,获得各种特征。6.如权利要求5所述的系统,其特征在于,所述计算层具体用于:根据所述内容数据对应的物料计算包,对所述内容数据进行物料抽取,获得内容物料;以及,根据所述用户数据对应的物料计算包,对所述用户数据进行物料抽取,获得用户物料;根据所述内容物料对应的特征算子包,对所述内容物料进行特征工程处理,获得内容特征;以及,根据所述用户物料对应的特征算子包,对所述用户物料进行特征工程处理,获得用户特征。7.如权利要求5或6所述的系统,其特征在于,所述计算层还用于:从消息队列中获...

【专利技术属性】
技术研发人员:任鹏飞谢煜锋叶宜拓潘照明王洲天
申请(专利权)人:网易传媒科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1