数据异常的识别方法、系统、电子设备和介质技术方案

技术编号:33716003 阅读:35 留言:0更新日期:2022-06-06 08:59
本发明专利技术公开了一种数据异常的识别方法、系统、电子设备和介质,述识别方法包括:获取用户画像数据的指标参数;所述指标参数用于表征用户画像数据变化的参数;判断所述指标参数是否符合正态分布,若是,则对所述指标参数进行参数异常检验,以识别出异常数据,若否,则对所述指标参数采用进行非参数异常检验,以识别出异常数据。本发明专利技术从而提高了用户画像的异常数据识别准确率。识别准确率。识别准确率。

【技术实现步骤摘要】
数据异常的识别方法、系统、电子设备和介质


[0001]本专利技术涉及计算机
,尤其涉及一种数据异常的识别方法、系统、电子设备和介质。

技术介绍

[0002]当下在OTA行业中,采用数据驱动业务是一种行业趋势。基于海量的用户基础属性、交易和浏览等行为数据,我们通过数据清洗、聚合、挖掘构建基于用户的画像标签。在生成画像标签的过程中,数据是否能够准确、高效的进入下游流程是需要重点关注的问题。
[0003]当前对于用户画像数据异常监控的策略主要存在以下的问题:
[0004]第一,画像标签繁多,相互独立,且量纲不统一,难以使用单一维度的标准进行量化并异常检验;
[0005]第二,衡量画像标签变化的指标体系,通常为天粒度数据,且具备一定时效性,因此在异常检验中可采集的样本数据较少,无法使用大数据分析方法,需要从传统统计学方法入手解决;
[0006]第三,多个画像标签的变化指标数据并不都服从于确定性的参数假设,难以基于参数检验的方法对数据进行假设,并进行异常检验。
[0007]因当前对于用户画像数据异常监控的策略本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据异常的识别方法,其特征在于,所述识别方法包括:获取用户画像数据的指标参数;所述指标参数用于表征用户画像数据变化的参数;判断所述指标参数是否符合正态分布,若是,则对所述指标参数进行参数异常检验,以识别出异常数据,若否,则对所述指标参数采用进行非参数异常检验,以识别出异常数据。2.如权利要求1所述的数据异常的识别方法,其特征在于,在判断出所述指标参数不符合正态分布之后,所述识别方法包括:将所述指标参数进行变换以生成目标参数,并返回所述判断所述指标参数是否符合正态分布的步骤。3.如权利要求1所述的数据异常的识别方法,其特征在于,在识别出异常数据的步骤之后,所述识别方法还包括:判断所述异常数据是否符合预设要求,若是,则对所述异常数据进行过滤;和/或,触发所述用户画像数据的熔断,并发送告警信号。4.如权利要求1所述的数据异常的识别方法,其特征在于,所述指标参数包括用户画像数据的更新率、用户画像数据的变更率、用户画像数据的删除率、用户画像数据的向前KL散度以及用户画像数据的向后KL散度。5.一种数据异常的识别系统,其特征在于,所述识别系统包括:获取模块,用于获取用户画像数据的指标参数;所述指标参数用于表征用户画像数据变化的参数;第一判断模块,用于判断所述指...

【专利技术属性】
技术研发人员:李康吴克贤陈海强陆刚邹宇
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1