当前位置: 首页 > 专利查询>青岛大学专利>正文

云存储服务器的数据监控方法、装置及设备制造方法及图纸

技术编号:22075621 阅读:40 留言:0更新日期:2019-09-12 14:06
本申请公开了一种云存储服务器的数据监控方法、装置、设备及计算机可读存储介质,能获取待上传数据的用户属性信息;确定待上传数据的用户属性信息与待上传数据的副本数据的用户属性信息之间的相似度,得到相似度集合;确定相似度集合中超过相似度阈值的相似度的总数量;最终在确定总数量超过数量阈值时,根据生长曲线函数模型对待上传数据的流行度数值进行更新,并存储待上传数据。可见,该方案在用户上传数据时,会计算该用户属性与已上传该数据的用户的属性之间的相似性,根据相似性决定数据流行度数值的更新方式,这种基于用户属性自适应调整数据流行度数值的方式,避免了流行度数值调整方式单一带来的数据泄露问题,提升了数据的安全性。

Data Monitoring Method, Device and Equipment of Cloud Storage Server

【技术实现步骤摘要】
云存储服务器的数据监控方法、装置及设备
本申请涉及数据去重领域,特别涉及一种云存储服务器的数据监控方法、装置、设备及计算机可读存储介质。
技术介绍
数据去重技术是一种能够识别和消除冗余数据、只存储单一副本数据的缩减技术,广泛应用于云存储领域。云存储服务器负责存储大量用户上传的数据,在云存储服务器执行数据去重时,需要在不同用户之间共享数据加密密钥或参数,为提高存储效率的同时保证用户数据安全,云存储服务通常采用划分流行度的去重方法,即定义一个流行度阈值,当上传某一数据的用户数量达到或者超过既定阈值,则将该数据视为流行数据,否则为非流行数据。服务器对流行数据进行去重操作,从而提高非流行数据的安全性。目前基于流行度的去重方法主要为:云存储服务器为数据分配统一的既定阈值,每当有一个用户上传某数据时,服务器为该数据的流行度数值加1。当数据的副本数量达到或者超过既定阈值,则该数据被视为流行数据,否则为非流行数据。这种方法的缺陷是:在实际应用场景中,某些数据的上传者来自于同一群体,例如公司,如果该公司员工数量较多,会导致这些数据在云存储服务器上的流行度数值很快达到甚至超过既定阈值。而事实上这些数据并非真正的“流行”,也就是说这些数据并非被网络上的诸多独立的用户所拥有,这些数据只是被该公司拥有。由于数据去重需要在不同用户之间共享数据加密密钥或参数,因此去重操作可能会导致内部数据泄露或者加密密钥和参数的对外泄漏。在这种情况下,如果采用传统的流行度数值更新方法对该类数据进行去重处理,可能导致内部数据泄露等问题。可见,传统的基于流行度的数据去重方法的流行度计算方式单一,导致数据存在泄漏的可能,安全性较低。
技术实现思路
本申请的目的是提供一种云存储服务器的数据监控方法、装置、设备及计算机可读存储介质,用以解决传统的基于流行度的数据去重方法的流行度数值更新方式单一,导致数据安全性较低的问题。具体方案如下:第一方面,本申请提供了一种云存储服务器的数据监控方法,包括:获取待上传数据的用户属性信息;确定所述待上传数据的用户属性信息与所述待上传数据的副本数据的用户属性信息之间的相似度,得到相似度集合;确定所述相似度集合中超过相似度阈值的相似度的总数量;在所述总数量超过数量阈值时,根据生长曲线函数模型对所述待上传数据的流行度数值进行更新,并存储所述待上传数据。可选的,所述在所述总数量超过数量阈值时,根据生长曲线函数模型对所述待上传数据的流行度数值进行更新,包括:在所述总数量超过数量阈值时,确定所述待上传数据的上传用户为集团用户,并根据生长曲线函数模型对所述待上传数据的流行度数值进行更新;在所述总数量未超过所述数量阈值时,确定所述待上传数据的上传用户为个人用户,并将所述待上传数据的流行度数值加一。可选的,所述确定所述待上传数据的用户属性信息与所述待上传数据的副本数据的用户属性信息之间的相似度,包括:分别为不同信息类型的用户属性信息设置对应的相似度计算方式;在计算相似度的过程中,根据当前用户属性信息的信息类型确定目标相似度计算方式,并按照所述目标相似度计算方式,确定所述待上传数据的当前用户属性信息与所述待上传数据的副本数据的当用户属性信息之间的相似度。可选的,所述信息类型包括以下任意一项或多项:确定数值型、确定符号型、确定区间型、模糊区间型、模糊数值型、模糊语义型。第二方面,本申请还提供了一种云存储服务器的数据监控装置,包括:属性信息获取模块:用于获取待上传数据的用户属性信息;相似度确定模块:用于确定所述待上传数据的用户属性信息与所述待上传数据的副本数据的用户属性信息之间的相似度,得到相似度集合;数量确定模块:用于确定所述相似度集合中超过相似度阈值的相似度的总数量;更新模块:用于在所述总数量超过数量阈值时,根据生长曲线函数模型对所述待上传数据的流行度数值进行更新,并存储所述待上传数据。可选的,所述更新模块包括:集团用户更新单元:用于在所述总数量超过数量阈值时,确定所述待上传数据的上传用户为集团用户,并根据生长曲线函数模型对所述待上传数据的流行度数值进行更新;个人用户更新单元:用于在所述总数量未超过所述数量阈值时,确定所述待上传数据的上传用户为个人用户,并将所述待上传数据的流行度数值加一。可选的,所述相似度确定模块包括:类型设置单元:用于分别为不同信息类型的用户属性信息设置对应的相似度计算方式;相似度计算单元:用于在计算相似度的过程中,根据当前用户属性信息的信息类型确定目标相似度计算方式,并按照所述目标相似度计算方式,确定所述待上传数据的当前用户属性信息与所述待上传数据的副本数据的当用户属性信息之间的相似度。第三方面,本申请还提供了一种云存储服务器的数据监控设备,包括:存储器:用于存储计算机程序;处理器:用于执行所述计算机程序,以实现如上所述的一种云存储服务器的数据监控方法的步骤。第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时用于实现如上所述的一种云存储服务器的数据监控方法的步骤。本申请所提供的一种云存储服务器的数据监控方法、装置、设备及计算机可读存储介质,能够获取待上传数据的用户属性信息;确定待上传数据的用户属性信息与待上传数据的副本数据的用户属性信息之间的相似度,得到相似度集合;然后确定相似度集合中超过相似度阈值的相似度的总数量;最终在确定总数量超过数量阈值时,根据生长曲线函数模型对待上传数据的流行度数值进行更新,并存储待上传数据。可见,该方案在用户上传数据时,会计算该用户的属性与已上传该数据的用户的属性之间的相似性,进而根据相似性决定数据流行度数值的更新方式,这种基于用户属性自适应调整数据流行度数值的方式,避免了流行度数值调整方式单一带来的数据泄露问题,显著提升了数据的安全性。附图说明为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请所提供的一种云存储服务器的数据监控方法实施例一的实现流程图;图2为本申请所提供的一种云存储服务器的数据监控方法实施例二的实现流程图;图3为本申请所提供的一种云存储服务器的数据监控装置实施例的功能框图;图4为本申请所提供的一种云存储服务器的数据监控设备实施例的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。目前,基于流行度的数据去重方案的流行度数值调整方式为:每当有一个用户上传数据时,该数据的流行度数值加1。这种流行度数值的调整方式过于单一,容易导致数据泄露,降低了数据的安全性。针对该问题,本申请提供了一种云存储服务器的数据监控方法、装置、设备及计算机可读存储介质,实现了基于用户属性自适应调整数据流行度数值的目的,显著提升了数据的安全性。下面对本申请提供的一种云存储服务本文档来自技高网
...

【技术保护点】
1.一种云存储服务器的数据监控方法,其特征在于,包括:获取待上传数据的用户属性信息;确定所述待上传数据的用户属性信息与所述待上传数据的副本数据的用户属性信息之间的相似度,得到相似度集合;确定所述相似度集合中超过相似度阈值的相似度的总数量;在所述总数量超过数量阈值时,根据生长曲线函数模型对所述待上传数据的流行度数值进行更新,并存储所述待上传数据。

【技术特征摘要】
1.一种云存储服务器的数据监控方法,其特征在于,包括:获取待上传数据的用户属性信息;确定所述待上传数据的用户属性信息与所述待上传数据的副本数据的用户属性信息之间的相似度,得到相似度集合;确定所述相似度集合中超过相似度阈值的相似度的总数量;在所述总数量超过数量阈值时,根据生长曲线函数模型对所述待上传数据的流行度数值进行更新,并存储所述待上传数据。2.如权利要求1所述的方法,其特征在于,所述在所述总数量超过数量阈值时,根据生长曲线函数模型对所述待上传数据的流行度数值进行更新,包括:在所述总数量超过数量阈值时,确定所述待上传数据的上传用户为集团用户,并根据生长曲线函数模型对所述待上传数据的流行度数值进行更新;在所述总数量未超过所述数量阈值时,确定所述待上传数据的上传用户为个人用户,并将所述待上传数据的流行度数值加一。3.如权利要求1或2所述的方法,其特征在于,所述确定所述待上传数据的用户属性信息与所述待上传数据的副本数据的用户属性信息之间的相似度,包括:分别为不同信息类型的用户属性信息设置对应的相似度计算方式;在计算相似度的过程中,根据当前用户属性信息的信息类型确定目标相似度计算方式,并按照所述目标相似度计算方式,确定所述待上传数据的当前用户属性信息与所述待上传数据的副本数据的当用户属性信息之间的相似度。4.如权利要求3所述的方法,其特征在于,所述信息类型包括以下任意一项或多项:确定数值型、确定符号型、确定区间型、模糊区间型、模糊数值型、模糊语义型。5.一种云存储服务器的数据监控装置,其特征在于,包括:属性信息获取模块:用于获取待上传数据的用户属性信息;相似度确...

【专利技术属性】
技术研发人员:咸鹤群高原
申请(专利权)人:青岛大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1