The invention discloses a data processing method and device. The method includes: training data extraction and corresponding algorithm from the source dataset set; processed by the algorithm on the training data set, the results generated data set; according to the feedback information of the data set label, a marking data set will be marking; the data set according to the storage of source data set is stored as a validation data set. The method by using the feedback information of the data set and label marking data set as a validation data set of iterative training algorithm, which can optimize, improve the performance of the algorithm.
【技术实现步骤摘要】
数据处理方法及其设备
本申请涉及计算机软件
,特别涉及一种数据处理方法及其设备。
技术介绍
目前,随着互联网的快速发展,各种形式的在线交易不断涌现。为了安全、预测等各种目的,可通过历史交易数据和预定训练模型对交易数据进行处理,基于处理结果对相应算法进行验证。例如,可通过交易数据的异常告警算法对交易数据进行实时监控并基于监控结果生成告警数据,随后,根据商家反馈或数据跟踪,对相应告警数据进行打标签(简称“打标”),若告警正确,则打标为“+”,若告警错误,则打标为“—”,然后对交易数据进行打标。由此可以看出,现有方法中并未对打标后的数据进行利用和管理。
技术实现思路
本专利技术的主要目的在于提供一种,旨在解决以上提到的问题。本申请实施例提供一种数据处理方法,所述方法包括:从源数据集中提取与算法对应的训练数据集;通过所述算法对训练数据集进行处理,生成结果数据集;根据反馈信息对结果数据集打标签,生成打标数据集;将打标数据集按照源数据集的存储方式存储为验证数据集。本申请另一实施例提供一种数据处理设备,所述设备包括:提取模块,从源数据集中提取与算法对应的训练数据集;第一生成模块,通过所述算法对训练数据集进行处理,生成结果数据集;第二生成模块,根据反馈信息对结果数据集打标签,生成打标数据集;存储模块,将打标数据集按照源数据集的存储方式存储为验证数据集。本申请实施例采用的上述至少一个技术方案通过利用反馈信息对结果数据集进行打标签并将打标数据集作为验证数据集对算法进行迭代训练,从而能够对算法进行优化,提高算法的性能。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成 ...
【技术保护点】
一种数据处理方法,其特征在于,包括:从源数据集中提取与算法对应的训练数据集;通过所述算法对训练数据集进行处理,生成结果数据集;根据反馈信息对结果数据集打标签,生成打标数据集;将打标数据集按照源数据集的存储方式存储为验证数据集。
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:从源数据集中提取与算法对应的训练数据集;通过所述算法对训练数据集进行处理,生成结果数据集;根据反馈信息对结果数据集打标签,生成打标数据集;将打标数据集按照源数据集的存储方式存储为验证数据集。2.如权利要求1所述的方法,其特征在于,在从源数据集中提取与算法对应的训练数据集之前,还包括:确定与选择的应用场景对应的算法。3.如权利要求2所述的方法,其特征在于,在确定与选择的应用场景对应的算法之前,还包括:预先将应用场景和与应用场景对应的算法进行关联存储。4.如权利要求1至3中的任一权利要求所述的方法,其特征在于,所述源数据集是将从多种数据库中提取的数据集进行数据清洗后的数据集。5.如权利要求1所述的方法,其特征在于,所述源数据集按照每列与特征对应的数据表形式存储。6.如权利要求1所述的方法,其特征在于,在生成打标数据集之后,还包括:调用验证数据集中的数据对所述算法的性能进行评价。7.如权利要求1所述的方法,将打标数据集按照源数据集的存储方式存储为验证数据集的步骤包括:将打标数据集转换为与源数据集的数据表形式相同的数据表;将转换后的数据表作为验证数据集存储到所述源数据集所在的数据仓库中。...
【专利技术属性】
技术研发人员:吴娅,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。