本申请提供一种数据分析方法、装置、电子设备及可读取存储介质,涉及信息处理技术领域,该方法包括:获取访问数据,并对所述访问数据进行预处理;将预处理后的所述访问数据输入至趋势提取滤波器,以获取趋势数据;根据所述趋势数据对所述访问数据进行分析。先对获取的访问数据进行预处理可以过滤出无效的访问数据,然后再利用趋势提取滤波器基于时间从预处理后的访问数据中提取包括趋势成分和噪声成分的趋势数据,从而保证根据趋势数据能够准确的对访问数据进行分析,进而保证对访问数据进行有效的评估。
A data analysis method, device, electronic equipment and readable storage medium
【技术实现步骤摘要】
一种数据分析方法、装置、电子设备及可读取存储介质
本申请涉及信息处理
,具体而言,涉及一种数据分析方法、装置、电子设备及可读取存储介质。
技术介绍
网页以及网站平台中的文章、视频等的访问量对于广告投放方、内容提供商等具有重要的参考意义,但是可以通过作假的方式提高访问量,造成访问量的异常,目前访问量是否有异常可以通过数据平滑、阈值检测、KSigma异常检测以及分位数异常检测等多种方式检测出来,但是这些方式都需要大量标注样本进行模型训练,且实际访问量变化的多变性导致无法准确的对访问量进行分析。
技术实现思路
本申请实施例的目的在于提供一种数据分析方法、装置、电子设备及可读取存储介质,用以改善现有技术中无法准确的对访问量进行分析的问题。第一方面,本申请实施例提供了一种数据分析方法,所述方法包括:获取访问数据,并对所述访问数据进行预处理;将预处理后的所述访问数据输入至趋势提取滤波器,以获取趋势数据;根据所述趋势数据对所述访问数据进行分析。在上述实现过程中,先对获取的访问数据进行预处理可以过滤出无效的访问数据,然后再利用趋势提取滤波器基于时间从预处理后的访问数据中提取包括趋势成分和噪声成分的趋势数据,从而保证根据趋势数据能够准确的对访问数据进行分析,进而保证对访问数据进行有效的评估。可选地,所述访问数据包括访问量以及所述访问量对应的检测时间点,所述获取访问数据,并对所述访问数据进行预处理,包括:去除所述访问数据中的无效数据得到更新后的访问数据;根据更新前的访问数据中的访问量以及所述检测时间点以及所述更新后的访问数据中的访问量以及所述检测时间点进行估算,得到估算后的访问数据,其中,所述估算后的访问数据包括等间隔的检测时间点以及所述等间隔的检测时间点对应的估算访问量;根据所述等间隔的检测时间点以及所述等间隔的检测时间点对应的估算访问量计算访问量变化率。在上述实现过程中,先通过预处理的方式将无规律的访问数据变换为有规律的访问数据,再通过趋势提取滤波器的处理能够更准确的分析访问数据,从而能够更有效的对访问数据进行评估。可选地,所述趋势数据包括趋势以及周期,所述根据所述趋势数据对所述访问数据进行分析,包括:根据所述趋势以及所述周期计算预处理后的所述访问数据中超出预设波动范围的异常访问数据;对所述异常访问数据进行计算分析得到所述访问数据的含水量。在上述实现过程中,根据趋势提取滤波器提取的趋势和周期准确的分析预处理后的所述访问数据中超出预设波动范围的异常访问数据,然后再根据异常访问数据计算访问数据的含水量,能够保证准确的分析出访问数据的真实水平,从而有效的对访问数据进行评估,进而为广告投放方、内容提供商等提供参考。可选地,所述趋势数据包括趋势,所述根据所述趋势数据对所述访问数据进行分析,包括:采用指数平滑法对所述趋势进行预测分析,并得到预测值。由于指数平滑法能够进一步加强观察近期观察值对预测值的影响作用,从而可以对不同时间的观察值赋予不同的权数,从而加大了近期观察值的权数,进而使预测值能够准确反映数据实际的变化,也就是说,得到的预测值能够准确的反应出访问数据的变化趋势,从而为广告投放方、内容提供商等提供有效的参考。可选地,所述获取访问数据,并对所述访问数据进行预处理之后,所述方法包括:将预处理后的所述访问数据分别输入至目标参数取不同数值的多个趋势提取滤波器;获取所述多个趋势提取滤波器输出的多个趋势数据,并根据所述多个趋势数据分析所述访问数据。在上述实现过程中,对于只有目标参数不同的趋势提取滤波器,其对趋势提取的敏感度不同,因此对同一组访问数据进行趋势提取后能够得到多个趋势数据,进而可以综合分析后分析出访问数据的特征,继而为广告投放方、内容提供商等提供有效的参考。第二方面,本申请实施例提供了一种数据分析装置,所述装置包括:预处理模块,用于获取访问数据,并对所述访问数据进行预处理;趋势数据获取模块,用于将预处理后的所述访问数据输入至趋势提取滤波器,以获取趋势数据;数据分析模块,用于根据所述趋势数据对所述访问数据进行分析。可选地,所述访问数据包括访问量以及所述访问量对应的检测时间点,所述预处理模块包括:数据更新单元,用于去除所述访问数据中的无效数据得到更新后的访问数据;数据估算单元,用于根据更新前的访问数据中的访问量以及所述检测时间点以及所述更新后的访问数据中的访问量以及所述检测时间点进行估算,得到估算后的访问数据,其中,所述估算后的访问数据包括等间隔的检测时间点以及所述等间隔的检测时间点对应的估算访问量;访问量变化率计算单元,用于根据所述等间隔的检测时间点以及所述等间隔的检测时间点对应的估算访问量计算访问量变化率。可选地,所述趋势数据包括趋势以及周期,所述数据分析模块包括:异常访问数据处理单元,用于根据所述趋势以及所述周期计算预处理后的所述访问数据中超出预设波动范围的异常访问数据;含水量计算单元,用于对所述异常访问数据进行计算分析得到所述访问数据的含水量。可选地,所述趋势数据包括趋势,所述数据分析模块包括:预测分析单元,用于采用指数平滑法对所述趋势进行预测分析,并得到预测值。可选地,所述数据分析装置包括:多输入模块,用于将预处理后的所述访问数据分别输入至目标参数取不同数值的多个趋势提取滤波器;多趋势数据分析模块,用于获取所述多个趋势提取滤波器输出的多个趋势数据,并根据所述多个趋势数据分析所述访问数据。第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的方法。第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的方法。本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的一种数据分析方法的流程图;图2为本申请实施例提供的一种数据分析装置的结构框图;图3为本申请实施例提供的一种电子设备的结构框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施本文档来自技高网...
【技术保护点】
1.一种数据分析方法,其特征在于,所述方法包括:/n获取访问数据,并对所述访问数据进行预处理;/n将预处理后的所述访问数据输入至趋势提取滤波器,以获取趋势数据;/n根据所述趋势数据对所述访问数据进行分析。/n
【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:
获取访问数据,并对所述访问数据进行预处理;
将预处理后的所述访问数据输入至趋势提取滤波器,以获取趋势数据;
根据所述趋势数据对所述访问数据进行分析。
2.根据权利要求1所述的方法,其特征在于,所述访问数据包括访问量以及所述访问量对应的检测时间点,所述获取访问数据,并对所述访问数据进行预处理,包括:
去除所述访问数据中的无效数据得到更新后的访问数据;
根据更新前的访问数据中的访问量以及所述检测时间点以及所述更新后的访问数据中的访问量以及所述检测时间点进行估算,得到估算后的访问数据,其中,所述估算后的访问数据包括等间隔的检测时间点以及所述等间隔的检测时间点对应的估算访问量;
根据所述等间隔的检测时间点以及所述等间隔的检测时间点对应的估算访问量计算访问量变化率。
3.根据权利要求1所述的方法,其特征在于,所述趋势数据包括趋势以及周期,所述根据所述趋势数据对所述访问数据进行分析,包括:
根据所述趋势以及所述周期计算预处理后的所述访问数据中超出预设波动范围的异常访问数据;
对所述异常访问数据进行计算分析得到所述访问数据的含水量。
4.根据权利要求1所述的方法,其特征在于,所述趋势数据包括趋势,所述根据所述趋势数据对所述访问数据进行分析,包括:
采用指数平滑法对所述趋势进行预测分析,并得到预测值。
5.根据权利要求1所述的方法,其特征在于,所述获取访问数据,并对所述访问数据进行预处理之后,所述方法包括:
将预处理后的所述访问数据分别输入至目标参数取不同数值的多个趋势提取滤波器;
获取所述多个趋势提取滤波器输出的多个趋势数据,并根据所述多个趋势数据分...
【专利技术属性】
技术研发人员:薛睿蓉,卢亿雷,景艳山,
申请(专利权)人:恩亿科北京数据科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。