【技术实现步骤摘要】
一种海量数据的冷热数据区分方法及装置
[0001]本专利技术涉及数据存储
,特别是涉及一种海量数据的冷热数据区分方法及装置。
技术介绍
[0002]冷数据一般是较长时间之前的状态数据,即用户画像数据,常见的有银行凭证、税务凭证、医疗档案、影视资料等。冷数据不需要实时访问到离线数据,用于灾难恢复的备份或者因为要遵守法律规定必须保留一段时间的。
[0003]温数据是非即时的状态和行为数据。可以简单地理解为,把热数据和冷数据混在一起就成了温数据。比如用户近期对某一类型的话题特别感兴趣(热数据),与以往的行为(冷数据)形成鲜明对比,这说明该用户正处于新用户的成长期(温数据),运营人员就可以考虑用相应的策略去拉动活跃度并促进转化。
[0004]热数据指即时的位置状态、交易和浏览行为。如即时的地理位置,某一特定时间活跃的手机应用等,能够表征“正在什么位置干什么事情”。另外一些实时的记录信息,如用户刚刚打开某个软件或者网站进行了一些操作,热数据可以通过第三方平台去积累,开发者也可以根据用户使用行为积累。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种海量数据的冷热数据区分方法,包括如下步骤:步骤S1,收集若干待区分冷热的数据的相关信息;步骤S2,以收集的信息中访问频次对收集的所有待区分冷热的数据的相关信息进行排列,每隔若干时间,获取所有待区分冷热的数据对应的访问频次的中位数;步骤S3,根据步骤S2确定的中位数,根据所有待区分冷热的数据的访问频次进行冷热数据划分,将所有待区分冷热的数据划分为冷数据序列和热数据序列。2.如权利要求1所述的一种海量数据的冷热数据区分方法,其特征在于,于步骤S3后,所述方法还包括如下步骤:步骤S4,利用最近一次的访问时间来分别判断划分后的冷数据序列与热数据序列,确定冷数据序列中的偏冷数据以及确定热数据序列中的偏热数据。3.如权利要求2所述的一种海量数据的冷热数据区分方法,其特征在于,于步骤S4后,所述方法还包括如下步骤:步骤S5,根据划分结果,根据不同的温度将所有待区分冷热的数据存至不同的存储介质中。4.如权利要求3所述的一种海量数据的冷热数据区分方法,其特征在于:于步骤S1中,所收集的待区分冷热的数据的相关信息至少包括数据的访问频次、最近一次访问时间以及该数据的存放地址。5.如权利要求4所述的一种海量数据的冷热数据区分方法,其特征在于:采用一多维数组存放所收集的待区分冷热的数据的相关信息,并使该多维数组中的数据在访问频次的列上有序。6.如权利要求5所述的一种海量数据的冷热数据区分方法,其特征在于:于步骤S2中,若该多维数组包括n行数据,则以其访问频次对应的列的数据进行排序,若n为奇数,则其中位数为该多维数...
【专利技术属性】
技术研发人员:安万民,姚国军,陈勇铨,
申请(专利权)人:上海英方软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。