一种数据处理方法和相关装置制造方法及图纸

技术编号:39255741 阅读:12 留言:0更新日期:2023-10-30 12:07
本申请公开一种数据处理方法和相关装置,可应用于人工智能等各种场景,可以首先获取待定特征数据在该待定特征数据的生命周期中对应的多个阶段,其中,生命周期可以用于标识待定特征数据从生成到应用的全过程。即,可以利用多个阶段对待定特征数据的生命周期进行标识,进而在分析待定特征数据的成本时,可以分别确定待定特征数据在多个阶段中的每个阶段对应的阶段成本。基于此,相较于直接利用总成本分析待定特征数据的成本的方式,从各个阶段对应的阶段成本能够实现对成本的细粒度分析。最后,可以根据多个阶段分别对应的阶段成本对待定特征数据进行成本评估,基于阶段成本这种细粒度的成本评估更为准确,便于更好地指导成本优化等。本优化等。本优化等。

【技术实现步骤摘要】
一种数据处理方法和相关装置


[0001]本申请涉及数据处理
,特别是涉及一种数据处理方法和相关装置。

技术介绍

[0002]特征数据可以用于描述对象的特性等,比如,特征数据可以是指对象的对象画像。其中,对象可以是指用户等。
[0003]通常,获取特征数据需要消耗一定的成本,通过对特征数据的成本进行分析,能够为特征数据的成本优化等提供指导性作用,以解决数据量级较大的特征数据的成本消耗较高的问题。
[0004]相关技术中,通常利用应用业务对应的总成本评估特征数据的成本。然而,这种成本分析方法过于粗糙,无法准确评估特征数据的成本,因此无法很好地指导成本优化等。

技术实现思路

[0005]为了解决上述技术问题,本申请提供了一种数据处理方法和相关装置,基于阶段成本这种细粒度的成本评估更为准确,便于更好地指导成本优化等。
[0006]本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供一种数据处理方法,所述方法包括:
[0008]获取待定特征数据在所述待定特征数据的生命周期中对应的多个阶段;
[0009]确定所述待定特征数据在所述多个阶段中的每个阶段对应的阶段成本;
[0010]根据所述多个阶段分别对应的阶段成本对所述待定特征数据进行成本评估。
[0011]又一方面,本申请实施例提供一种数据处理装置,所述装置包括获取单元、确定单元和评估单元:
[0012]所述获取单元,用于获取待定特征数据在所述待定特征数据的生命周期中对应的多个阶段;
[0013]所述确定单元,用于确定所述待定特征数据在所述多个阶段中的每个阶段对应的阶段成本;
[0014]所述评估单元,用于根据所述多个阶段分别对应的阶段成本对所述待定特征数据进行成本评估。
[0015]另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:
[0016]所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
[0017]所述处理器用于根据所述计算机程序中的指令执行前述任一方面所述的方法。
[0018]另一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行前述任一方面所述的方法。
[0019]另一方面,本申请实施例提供一种计算机程序产品,包括计算机程序,当其在计算机设备上运行时,使得所述计算机设备执行时实现前述任一方面所述的方法。
[0020]由上述技术方案可以看出,可以首先获取待定特征数据在该待定特征数据的生命周期中对应的多个阶段,其中,生命周期可以用于标识待定特征数据从生成到应用的全过程。也就是说,可以利用多个阶段对待定特征数据的生命周期进行标识,进而在分析待定特征数据的成本时,可以分别确定待定特征数据在多个阶段中的每个阶段对应的阶段成本。基于此,相较于直接利用总成本分析待定特征数据的成本的方式,从各个阶段对应的阶段成本能够实现对成本的细粒度分析。最后,可以根据多个阶段分别对应的阶段成本对待定特征数据进行成本评估,基于阶段成本这种细粒度的成本评估更为准确,便于更好地指导成本优化等。
附图说明
[0021]为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术成员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本申请实施例提供的一种数据处理方法的应用场景示意图;
[0023]图2为本申请实施例提供的一种数据处理方法的流程图;
[0024]图3为本申请实施例提供的一种成本分析框架的示意图;
[0025]图4为本申请实施例提供的一种成本分析逻辑的示意图;
[0026]图5为本申请实施例提供的一种成本分析系统的架构示意图;
[0027]图6为本申请实施例提供的一种成本分析系统的运行流程示意图;
[0028]图7为本申请实施例提供的一种数据处理装置的结构图;
[0029]图8为本申请实施例提供的一种终端设备的结构图;
[0030]图9为本申请实施例提供的一种服务器的结构图。
具体实施方式
[0031]下面结合附图,对本申请的实施例进行描述。
[0032]特征数据可以用于描述对象的特性等,比如,特征数据可以是指对象的对象画像。其中,对象可以是指用户等。以对象是用户为例,对象画像能够用于描述用户的习惯、喜好等特性。
[0033]通常,特征数据可以是预先离线生成好的,在推荐领域、增长领域等具有重要作用。在应用阶段,可以根据应用业务的具体需求进行调用。比如,在推荐领域,可以根据推荐业务的需求调用特征数据,基于特征数据所反映的对象的特性为对象推荐可能感兴趣的内容等。可以理解的是,无论是在特征数据的生成过程,还是特征数据的调用过程,通常需要购买其他资源(比如存储资源、调用服务资源等),购买其他资源对应产生成本,相应的,则可以认为在获取特征数据时,需要消耗一定的成本。在实际应用中,可以将获取特征数据消耗的成本可以称为特征数据的成本,具体可以是指获取该特征数据需要消耗的资源。
[0034]通过对特征数据的成本进行分析,能够为特征数据的成本优化等提供指导性作用,以解决数据量级较大的特征数据的成本消耗较高的问题,有利于降低成本。相关技术中,通常利用应用业务对应的总成本评估特征数据的成本。比如,将某次购买其他资源时共
产生的成本记为总成本,则直接利用均摊的思想将总成本均摊到各个特征数据,基于此评估特征数据的成本。
[0035]然而,相关技术中所采用的成本分析方法过于粗糙,主要表现在无法准确评估特征数据的成本在特征数据的生命周期中的具体分布情况。其中,生命周期可以用于标识特征数据从生成到应用的全过程。由此,当需要进行成本优化等时,因为无法准确评估特征数据的成本在特征数据的生命周期中的具体分布情况,从而无法准确确定出是在哪个阶段的成本消耗过高等,因此无法很好地指导成本优化等。
[0036]为此,本申请实施例提供了一种数据处理方法和相关装置,利用多个阶段对特征数据的生命周期进行标识,进而在成本分析时,可以分别确定特征数据在各个阶段对应的阶段成本。基于此,相较于直接利用总成本分析成本的方式,从各个阶段对应的阶段成本能够实现对成本的细粒度分析。利用各个阶段的阶段成本能够明确特征数据的成本在特征数据的生命周期中的具体分布情况,这种细粒度的成本评估更为准确,因此能够更好地指导成本优化等。
[0037]本申请实施例所提供的数据处理方法可以通过计算机设备实施,该计算机设备可以是终端设备或服务器,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备包括但不限于手机、电脑、智能语音交互设备、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待定特征数据在所述待定特征数据的生命周期中对应的多个阶段;确定所述待定特征数据在所述多个阶段中的每个阶段对应的阶段成本;根据所述多个阶段分别对应的阶段成本对所述待定特征数据进行成本评估。2.根据权利要求1所述的方法,其特征在于,所述生命周期包括所述待定特征数据对应的生成过程和应用过程,所述多个阶段包括所述生成过程对应的生成阶段和所述应用过程对应的调用阶段。3.根据权利要求2所述的方法,其特征在于,所述确定所述待定特征数据在所述多个阶段中的每个阶段对应的阶段成本,包括:获取所述生成阶段对应的资源成本总值,以及获取所述待定特征数据在所述生成阶段的占比特征;根据所述占比特征和所述资源成本总值,确定所述待定特征数据在所述生成阶段对应的生成成本;获取所述待定特征数据在所述调用阶段对应的应用业务;根据所述应用业务调用所述待定特征数据的调用频次特征,确定所述待定特征数据在所述调用阶段对应的所述应用业务中的调用成本。4.根据权利要求3所述的方法,其特征在于,所述生成阶段包括第一阶段和第二阶段,所述资源成本总值包括所述第一阶段对应的第一资源成本值和所述第二阶段对应的第二资源成本值,所述获取所述待定特征数据在所述生成阶段的占比特征,包括:根据所述待定特征数据的数量与所述第一资源成本值对应的特征数据的数量,确定所述待定特征数据在所述第一阶段的数量占比特征,以及根据所述待定特征数据的数据大小与所述第二资源成本值对应的特征数据的数据大小,确定所述待定特征数据在所述第二阶段的数据大小占比特征;所述第一资源成本值对应的特征数据和所述第二资源成本值对应的特征数据均包括所述待定特征数据;所述根据所述占比特征和所述资源成本总值,确定所述待定特征数据在所述生成阶段对应的生成成本,包括:根据所述数量占比特征对所述第一资源成本值进行拆分处理,得到所述待定特征数据在所述第一阶段对应的第一成本,以及根据所述数据大小占比特征对所述第二资源成本值进行拆分处理,确定所述待定特征数据在所述第二阶段对应的第二成本;将所述第一成本与所述第二成本之和确定为所述待定特征数据对应的生成成本。5.根据权利要求4所述的方法,其特征在于,所述第一阶段包括源数据...

【专利技术属性】
技术研发人员:彭承晴
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1