数据监测方法、装置、计算设备及存储介质制造方法及图纸

技术编号:20160401 阅读:51 留言:0更新日期:2019-01-19 00:13
本说明书提供一种数据监测方法、装置、计算设备及存储介质,所述方法包括:获取目标对象的与第一设定日期相关的活跃度数据以及与第二设定日期相关的活跃度数据;根据所述第一用户活跃度数据和第二用户活跃度数据确定第一用户活跃度曲线的第一曲线类别和第二用户活跃度曲线的第二曲线类别;根据状态转移模型计算所述第一曲线类别与所述第二曲线类别之间状态转移概率;根据所述第一曲线类别和所述第二曲线类别之间的状态转移概率,将所述状态转移概率与所述第一曲线类别和所述第二曲线类别之间的预先设定的阈值进行比较,在所述状态转移概率低于阈值的情况下,发送提醒通知。

【技术实现步骤摘要】
数据监测方法、装置、计算设备及存储介质
本说明书涉及数据监测
,特别涉及一种数据监测方法、装置、计算设备及存储介质。
技术介绍
随着大数据的发展,各公司对数据的认识越来越深刻,我们每天都会产生大量的数据用于分析和决策中,在这一过程中,人力始终是有限的。因此对于筛选数据的系统的需求就会出现。目前对于数据筛选方面常用的做法是,对数据配置一些关键值作为阈值,如果所述状态转移概率低于阈值的情况下,发送提醒通知。
技术实现思路
有鉴于此,本说明书实施例提供了一种数据监测方法、装置、计算设备及存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种数据监测方法,包括:获取目标对象的与第一设定日期相关的第一用户活跃度数据以及与第二设定日期相关的第二用户活跃度数据;根据所述第一用户活跃度数据得到第一用户活跃度曲线以及所述第一用户活跃度曲线的第一变化属性特征,根据所述第二用户活跃度数据得到第二用户活跃度曲线以及所述第二用户活跃度曲线的第二变化属性特征;基于所述第一变化属性特征利用用户活跃度曲线分类模型得到所述第一用户活跃度曲线的第一曲线类别,基于所述第二变化属性特征利用所述用户活跃度曲线分类模型得到所述第二用户活跃度曲线的第二曲线类别;根据状态转移模型计算所述第一曲线类别与所述第二曲线类别之间状态转移概率;根据所述第一曲线类别和所述第二曲线类别之间的状态转移概率,将所述状态转移概率与所述第一曲线类别和所述第二曲线类别之间的预先设定的阈值进行比较,在所述状态转移概率低于阈值的情况下,发送提醒通知。可选的,所述获取目标对象的与第一设定日期相关的第一用户活跃度数据包括:从日志文件中提取目标对象在第一设定日期的预设时间区间内的用户活跃度数据。可选的,所述获取目标对象的与第二设定日期相关的第二用户活跃度数据包括:从日志文件中提取目标对象在第二设定日期的预设时间区间内的用户活跃度数据。可选的,所述第一曲线类别、所述第二曲线类别分别包括:稳步上升型,突增型,平缓型,反转型,周期型,急速上升型,和急速下降型。可选的,所述第一变化属性特征、所述第二变化属性特征分别包括:当前值在预设时间区间内的样本值中的排名,当前值比前一日数值的增长量,当前值比除当前值外最大的三个数值的平均值的增长量,当前值比除当前值以外最小的三个数值的平均值的增长量,当前值比平均值的增长量,用户活跃度数据形成的曲线中波峰的数目,用户活跃度数据形成的曲线中波谷的数目。可选的,所述用户活跃曲线分类模型通过如下步骤训练得到:获取用户活跃曲线分类模型的训练样本数据集,其中,所述训练样本数据集中包括多个预设时间区间内的用户活跃度数据以及每个预设时间区间对应的用户活跃度曲线;为每个预设时间区间内的用户活跃度数据构建变化属性特征;通过所述用户活跃度曲线和所述变化属性特征对预设模型进行训练,得到所述分类模型,所述分类模型使得所述用户活跃曲线与所述变化属性特征相关联。可选的,所述预设模型为采用R语言的Xgboost模型。可选的,所述状态转移模型为马尔可夫模型。可选的,所述状态转移概率与所述第一曲线类别和所述第二曲线类别之间的预先设定的阈值进行比较,其中每两条曲线类别之间的阈值都是不同的。根据本说明书实施例的第二方面,提供了一种数据监测装置,包括:获取模块,被配置为获取目标对象的与第一设定日期相关的第一用户活跃度数据以及与第二设定日期相关的第二用户活跃度数据;处理模块,被配置为根据所述第一用户活跃度数据得到第一用户活跃度曲线以及所述第一用户活跃度曲线的第一变化属性特征,根据所述第二用户活跃度数据得到第二用户活跃度曲线以及所述第二用户活跃度曲线的第二变化属性特征;分类模块,被配置为基于所述第一变化属性特征利用用户活跃度曲线分类模型得到所述第一用户活跃度曲线的第一曲线类别,基于所述第二变化属性特征利用所述用户活跃度曲线分类模型得到所述第二用户活跃度曲线的第二曲线类别;计算模块,被配置为根据状态转移模型计算所述第一曲线类别与所述第二曲线类别之间状态转移概率。通知模块,被配置为根据所述第一曲线类别和所述第二曲线类别之间的状态转移概率,将所述状态转移概率与所述第一曲线类别和所述第二曲线类别之间的预先设定的阈值进行比较,在所述状态转移概率低于阈值的情况下,发送提醒通知。根据本说明书实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现上述方法的步骤。根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,储有计算机指令,该指令被处理器执行时实现上述的方法的步骤。本申请提供了一种数据监测方法,获取目标对象与第一设定日期相关的第一用户活跃度数据和第二设定日期相关的第二用户活跃的数据,根据第一用户活跃度数据和第二用户活跃度数据分别得到第一用户活跃度曲线、第二用户活跃度曲线、第一用户活跃度曲线对应的第一变化属性特征和第二用户活跃度曲线对应的第二变化属性特征,根据所述第一变化属性特征利用分类模型得到第一曲线类别,所述第二变化属性特征利用分类模型得到第二曲线类别,通过状态转移模型计算得到第一曲线类别和第二曲线类别之间类别转移概率,对计算得到的较小的概率进行监测,本申请利用机器学习算法,通过对不同的曲线间的类别转移概率设定不同的阈值,实现了对各类数据发展趋势的监测。附图说明图1为本说明书一实施例提供的一种数据监测系统的结构示意图;图2为本说明书一实施例中的一种数据监测方法的流程图;图3为本说明书一实施例中的一种用户活跃度曲线图;图4为本说明书一实施例中的一种用户活跃度曲线图;图5为本说明书一实施例中的一种数据监测装置模块图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。下面通过具体实施例,对本专利技术进行详细说明。参考图1,图1为本说明书一实施例提供的一种数据监测系统的结构示意图,在介绍本申请的技术方案之前,首先对本申请所涉及的数据监测系统的架构进行说明。图1是示出了本说明书一实施例的数据监测系统的结构示意图。包括服务端110,网络130和终端120。所述服务端110和所述终端120的部件包括但不限于存储器和处理器。处理器与存储器通过总线相连接,数据库用于保存数据。服务端110和所述终端120还包括接入设备,接入设备使得服务端110和所述终端120能够经由一个或多个网络130通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。图2示出了本说明书一实施例中的一种数据监测方法的流程图,应用于服务端,如图2所示,包括步骤202至步骤208。步骤202:获取目标对象的与第一设本文档来自技高网...

【技术保护点】
1.一种数据监测方法,其特征在于,包括:获取目标对象的与第一设定日期相关的第一用户活跃度数据以及与第二设定日期相关的第二用户活跃度数据;根据所述第一用户活跃度数据得到第一用户活跃度曲线以及所述第一用户活跃度曲线的第一变化属性特征,根据所述第二用户活跃度数据得到第二用户活跃度曲线以及所述第二用户活跃度曲线的第二变化属性特征;基于所述第一变化属性特征利用用户活跃度曲线分类模型得到所述第一用户活跃度曲线的第一曲线类别,基于所述第二变化属性特征利用所述用户活跃度曲线分类模型得到所述第二用户活跃度曲线的第二曲线类别;根据状态转移模型计算所述第一曲线类别与所述第二曲线类别之间状态转移概率;根据所述第一曲线类别和所述第二曲线类别之间的状态转移概率,将所述状态转移概率与所述第一曲线类别和所述第二曲线类别之间的预先设定的阈值进行比较,在所述状态转移概率低于阈值的情况下,发送提醒通知。

【技术特征摘要】
1.一种数据监测方法,其特征在于,包括:获取目标对象的与第一设定日期相关的第一用户活跃度数据以及与第二设定日期相关的第二用户活跃度数据;根据所述第一用户活跃度数据得到第一用户活跃度曲线以及所述第一用户活跃度曲线的第一变化属性特征,根据所述第二用户活跃度数据得到第二用户活跃度曲线以及所述第二用户活跃度曲线的第二变化属性特征;基于所述第一变化属性特征利用用户活跃度曲线分类模型得到所述第一用户活跃度曲线的第一曲线类别,基于所述第二变化属性特征利用所述用户活跃度曲线分类模型得到所述第二用户活跃度曲线的第二曲线类别;根据状态转移模型计算所述第一曲线类别与所述第二曲线类别之间状态转移概率;根据所述第一曲线类别和所述第二曲线类别之间的状态转移概率,将所述状态转移概率与所述第一曲线类别和所述第二曲线类别之间的预先设定的阈值进行比较,在所述状态转移概率低于阈值的情况下,发送提醒通知。2.根据权利要求1所述的方法,其特征在于,所述获取目标对象的与第一设定日期相关的第一用户活跃度数据包括:从日志文件中提取目标对象在第一设定日期的预设时间区间内的用户活跃度数据。3.根据权利要求1所述的方法,其特征在于,所述获取目标对象的与第二设定日期相关的第二用户活跃度数据包括:从日志文件中提取目标对象在第二设定日期的预设时间区间内的用户活跃度数据。4.根据权利要求1所述的方法,其特征在于,所述第一曲线类别、所述第二曲线类别分别包括:稳步上升型,突增型,平缓型,反转型,周期型,急速上升型,和急速下降型;所述第一变化属性特征、所述第二变化属性特征分别包括:当前值在预设时间区间内的样本值中的排名,当前值比前一日数值的增长量,当前值比除当前值外最大的三个数值的平均值的增长量,当前值比除当前值以外最小的三个数值的平均值的增长量,当前值比平均值的增长量,用户活跃度数据形成的曲线中波峰的数目,用户活跃度数据形成的曲线中波谷的数目。5.根据权利要求1所述的方法,其特征在于,所述用户活跃曲线分类模型通过如下步骤训练得到:获取用户活跃曲线分类模型的训练样本数据集,其中,所述训练样本数据集中包括多个预设时间区间内的用户活跃度数据以及每个预设时间区间对应的用户活跃度曲线;为每个预设时间区间内的用户活跃度数据构建变化属性特征;通过所述用户活跃度曲线和所述变化属性特征对预设模型进行训练,得到所述用户活跃曲线分类模型,所述用户活跃曲线分类模型使得所述用户活跃曲线与所述变化属性特征相关联。6.根据权利要求5所述的方法,其特征在于,所述预设模型为采用R语言的Xgboost模型。7.根据权利要求1所述的方法,其特征在于,所述状态转移模型为马尔可夫模型。8.根据权利要求1所述的方法,其特征在于,所述状态转移概率与所述第一曲线类别和所述第二曲线类别之间的预先设定的阈值进行比较,其中每两条曲线类别之间的阈值都是不同的。9.一种数据监测装置,其特征在于,包括:获取模块,被配置为获取目标对象的与第一设定日期相关的第一用户活跃度数据以及与第二设定日期相关的第二用户活跃度数据;处理模块...

【专利技术属性】
技术研发人员:贾寅辰
申请(专利权)人:北京粉笔未来科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1