一种数据处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号:35089069 阅读:29 留言:0更新日期:2022-10-01 16:44
本申请公开了一种数据处理方法、装置、设备及可读存储介质,涉及通信技术领域,以降低数据标注的难度。该方法包括:获取待处理数据,所述待处理数据包括多个子数据且所述多个子数据按预设顺序排列;对所述待处理数据进行处理,得到至少一个目标区段数据以及所述至少一个目标区段数据对应的目标标签;其中,每个目标区段数据为所述待处理数据的一部分,所述目标标签用于指示对应的每个目标区段数据内发生了根因指向的事件。本申请实施例可以降低数据标注的难度。据标注的难度。据标注的难度。

【技术实现步骤摘要】
一种数据处理方法、装置、设备及可读存储介质


[0001]本申请涉及通信
,尤其涉及一种数据处理方法、装置、设备及可读存储介质。

技术介绍

[0002]根因分析指的是进行根本原因的分析。现有技术中,在进行根因分析时,对具体问题建立具体模型,利用模型来完成根因的分析。因此,需要对每个具体问题单独建模。在有数据支持引入机器学习算法的背景下,以根本原因作为标签,以监测指标或其它潜在相关数据作为特征输入,根因分析可以利用监督学习来解决。此类监督方法利用机器学习简化了建模过程,且具有较好的性能,但一般都面临数据不足的问题。其根本原因在于,对数据进行精细、准确的根因标注十分困难,成本较高。

技术实现思路

[0003]本申请实施例提供一种数据处理方法、装置、设备及可读存储介质,以降低数据标注的难度。
[0004]第一方面,本申请实施例提供了一种数据处理方法,包括:
[0005]获取待处理数据,所述待处理数据包括多个子数据且所述多个子数据按预设顺序排列;
[0006]对所述待处理数据进行处理,得到至少一个目标区段数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待处理数据,所述待处理数据包括多个子数据且所述多个子数据按预设顺序排列;对所述待处理数据进行处理,得到至少一个目标区段数据以及所述至少一个目标区段数据对应的目标标签;其中,每个目标区段数据为所述待处理数据的一部分,所述目标标签用于指示对应的每个目标区段数据内发生了根因指向的事件。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理数据进行处理,得到至少一个目标区段数据以及所述至少一个目标区段数据对应的目标标签,包括:将所述待处理数据通过区段生成器,生成至少一个第一区段数据;将所述至少一个第一区段数据通过分类器进行预测,得到每个区段数据在不同标签下的评分值;重复执行以下步骤,直至所述分类器的输出满足第一预设条件,并将在满足所述第一预设条件下获得的区段数据作为所述目标区段数据,将所述目标区段数据对应的标签作为所述目标标签:对于不同标签中的目标标签,根据评分值从所述目标标签对应的区段数据中选择第二区段数据;将所述第二区段数据中的第三区段数据进行合并,得到第四区段数据;将所述第四区段数据通过所述分类器进行预测,得到所述第四区段数据在不同标签下的评分值。3.根据权利要求2所述的方法,其特征在于,在所述将所述待处理数据通过区段生成器,生成至少一个第一区段数据之后,所述方法还包括:对所述至少一个第一区段数据进行预处理;所述将所述至少一个第一区段数据通过分类器进行预测,得到每个区段数据在不同标签下的评分值,包括:将预处理后的至少一个第一区段数据通过分类器进行预测,得到每个预处理后的区段数据在不同标签下的评分值。4.根据权利要求2所述的方法,其特征在于,在所述将所述第二区段数据中的第三区段数据进行合并,得到第四区段数据之后,所述方法还包括:对所述第四区段数据进行预处理;所述将所述第四区段数据通过所述分类器进行预测,包括:将预处理后的第四区段数据通过所述分类器进行预测,得到所述第四区段数据在不同标签下的评分值。5.根据权利要求2所述的方法,其特征在于,所述对于所述不同标签中的目标标签,根据评分值从所述目标标签对应的区段数据中选择第二区段数据,包括:从所述...

【专利技术属性】
技术研发人员:杨骄龙
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1