【技术实现步骤摘要】
本申请涉及通信,尤其涉及一种数据处理方法、装置、设备及存储介质。
技术介绍
1、spark是一个强大的分布式计算框架,用于处理大规模数据集的高性能计算,被广泛应用于各个行业例如金融、电信、医疗、零售、媒体等处理和分析大数据,从而提高业务效率、洞察潜在机会并进行智能决策。
2、通过计算spark应用程序的运行成本,可以实现成本控制、性能优化、资源规划和决策支持等方面目标,从而提高spark应用程序的效率和经济效益。此外,对于企业和组织而言,计算运行成本是可持续发展的管理实践的重要组成部分。然而,如何计算spark应用程序的运行成本面临很多挑战。
3、目前已有解决方案计算spark集群的整体成本,以综合评估整个集群的资源利用率和成本效益,进而支持集群规模和配置的优化。但是还未有解决方案针对单个spark应用程序进行运行成本分析,因而可能无法满足特定spark应用程序的优化和成本控制需求。
技术实现思路
1、本申请提供一种数据处理方法、装置、设备及存储介质,用于解决针对单
...【技术保护点】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的数据处理方法,其特征在于,所述根据Spark应用程序的事件日志目录获取目标事件日志文件的路径,包括:
3.根据权利要求2所述的数据处理方法,其特征在于,所述根据预设条件从所述事件日志目录中获取每个待处理事件日志文件的路径,包括:
4.根据权利要求1-3任一项所述的数据处理方法,其特征在于,根据所述所有事件中的特定事件确定所述Spark应用程序的资源指标,包括:
5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述资源指标得到所述Spark应用程序
...【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的数据处理方法,其特征在于,所述根据spark应用程序的事件日志目录获取目标事件日志文件的路径,包括:
3.根据权利要求2所述的数据处理方法,其特征在于,所述根据预设条件从所述事件日志目录中获取每个待处理事件日志文件的路径,包括:
4.根据权利要求1-3任一项所述的数据处理方法,其特征在于,根据所述所有事件中的特定事件确定所述spark应用程序的资源指标,包括:
5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述资源指标得到所述spark应用程序的资源使用量,包括:
6.根据权利要求5所述的数据处...
【专利技术属性】
技术研发人员:杨建丹,胡博文,杨波,黄兴如,闫龙,李大中,宋雨伦,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。