大数据访问授权方法、装置和大数据平台制造方法及图纸

技术编号:21572150 阅读:29 留言:0更新日期:2019-07-10 15:33
本发明专利技术提供了一种大数据访问授权方法、装置和大数据平台,所述方法包括:提取大数据平台认证用户的行为信息;根据业务场景对用户的行为信息进行评估,为用户打上多个维度的用户标签以构建用户画像,其中,每个用户标签所对应的标签权重通过将标签主观重要程度和标签客观重要程度进行融合得到;每间隔预设时间更新用户画像,实现用户标签及其标签权重的动态更新;根据更新后的用户画像对用户进行访问授权。本发明专利技术能够实现对不同用户的个性化授权,满足不同主体不断变化的个性化访问需求;能够减少对管理员专业知识的依赖,并便于实现管理员提前主动为用户授权;能够对用户可疑性与业务需求进行准确预测;能够有效提高大数据平台的数据安全性。

Large Data Access Authorization Method, Device and Large Data Platform

【技术实现步骤摘要】
大数据访问授权方法、装置和大数据平台
本专利技术涉及数据平台
,具体涉及一种大数据访问授权方法、一种大数据访问授权装置和一种大数据平台。
技术介绍
大数据时代的到来,使得数据成为了重要的经济资产,例如ApacheHadoop,凭借其出色的数据存储能力和分布式计算等优势,已经成为主要的处理大量数据的平台。但Hadoop在最初开发时主要围绕着如何管理大量的公共Web数据,缺乏数据的保密性和内部的复杂权限管理的考虑。而Hadoop平台存储的从不同企业、组织或机构收集的数据往往包含私人和敏感信息,且大数据平台面临的访问主体众多,很难既保证这些信息免受未经授权的访问,又满足不同主体不断变化的个性化访问需求。具体而言,目前统一授权管理的开源框架有ApacheSentry和ApacheRanger,二者均能够实现大数据访问授权管理的基本功能。其中,Sentry是基于角色的管理(RBAC),通过创建角色,将每个组件的权限授予给此角色,然后在用户中添加此角色,即用户具备此角色访问组件的权限;Ranger是基于策略的管理,每个组件可以添加服务Service,然后添加自定义策略,再添加组或用户访问权限。然而,Sentry和Ranger在进行授权时,均需要依赖管理员的专业知识制定授权策略,对管理员的要求和依赖较高。并且,Sentry和Ranger进行授权时,均未将用户历史访问行为作为授权策略参考依据,一旦用户近期风险较高,系统未及时发现便会对数据造成很大安全威胁。此外,目前的授权方法大多采用“用户申请-管理员审批“模式,管理员被动授权,不能提前主动为用户授权,不利于提高用户工作效率。
技术实现思路
本专利技术为解决目前的数据平台访问授权方法很难既保证一些信息免受未经授权的访问,又满足不同主体不断变化的个性化访问需求,以及对管理员的要求和依赖较高、不能提前主动为用户授权的技术问题,提供了一种大数据访问授权方法、装置和大数据平台。本专利技术采用的技术方案如下:一种大数据访问授权方法,包括以下步骤:提取大数据平台认证用户的行为信息;根据业务场景对所述用户的行为信息进行评估,为所述用户打上多个维度的用户标签以构建用户画像,其中,每个所述用户标签所对应的标签权重通过将标签主观重要程度和标签客观重要程度进行融合得到;每间隔预设时间更新所述用户画像,实现用户标签及其标签权重的动态更新;根据更新后的用户画像对所述用户进行访问授权。所述大数据平台为Hadoop平台,通过Hadoop生态圈组件,结合资源属性特征提取所述用户的行为信息。所述多个维度的用户标签包括用户基础属性、用户活跃情况、用户资源偏好、用户行为偏好、资源访问结果、用户可疑性。所述标签主观重要程度通过层次分析法进行评估,通过对每个所述用户标签的主观打分构建成对比较矩阵,然后计算矩阵特征向量得出。所述标签客观重要程度通过将用户的最新标签与历史标签相比较,并融合时间衰减因素得出。其中,通过用户活跃情况和用户可疑性判断用户异常状态;通过用户行为偏好和用户资源偏好识别用户的个性化访问需求;将不同维度的用户标签进行交叉组合以精确定位用户类型,并在不同类型的用户与资源之间建立起差异化的关联规则。一种大数据访问授权装置,包括:提取模块,所述提取模块用于提取大数据平台认证用户的行为信息;用户画像构建模块,所述用户画像构建模块用于根据业务场景对所述用户的行为信息进行评估,为所述用户打上多个维度的用户标签以构建用户画像,其中,所述用户画像构建模块通过将标签主观重要程度和标签客观重要程度进行融合得到每个所述用户标签所对应的标签权重;更新模块,所述更新模块用于每间隔预设时间更新所述用户画像,实现用户标签及其标签权重的动态更新;授权模块,所述授权模块用于根据更新后的用户画像对所述用户进行访问授权。所述大数据平台为Hadoop平台,所述提取模块通过Hadoop生态圈组件,结合资源属性特征提取所述用户的行为信息。所述多个维度的用户标签包括用户基础属性、用户活跃情况、用户资源偏好、用户行为偏好、资源访问结果、用户可疑性。一种大数据平台,包括上述大数据访问授权装置。本专利技术的有益效果:本专利技术通过对用户的行为信息进行评估,为用户打上多个维度的用户标签以构建用户画像,并融合标签主观重要程度和标签客观重要程度得到每个用户标签所对应的标签权重,以及每间隔预设时间更新用户画像,实现用户标签及其标签权重的动态更新,最后根据更新后的用户画像对用户进行访问授权,由此,能够实现对不同用户的个性化授权,满足不同主体不断变化的个性化访问需求;并且最终基于用户画像进行访问授权,可减少对管理员专业知识的依赖,并便于实现管理员提前主动为用户授权,提高业务人员工作效率;通过收集多个维度的用户信息,能够对用户可疑性与业务需求进行准确预测,进而采取授权动作,使授权行为有依据可循,具备可解释性;根据随时间动态变化的用户标签及其准确的权重来评估用户,使得用户与资源之间的对应关系更加精确,基于此决定是否收回或放宽用户的所有权限,避免资源遭受未授权人员的误操作行为和越权访问,从而有效提高大数据平台的数据安全性。附图说明图1为本专利技术实施例的大数据访问授权方法的流程图;图2为本专利技术一个实施例的实现大数据访问授权的整体框架图;图3为本专利技术一个实施例的用户权限范围与近期需求的关系示意图;图4为本专利技术实施例的大数据访问授权装置的方框示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,本专利技术实施例的大数据访问授权方法,包括以下步骤:S1,提取大数据平台认证用户的行为信息。参照图2,用户创建完成后,可基于kerberos进行KDC认证,赋予该用户申请访问的权限。在本专利技术的一个实施例中,大数据平台为Hadoop平台,在用户以用户ID登入Hadoop平台后,可通过Hadoop生态圈组件,例如Hdfs、Hive、HBase等,结合资源属性特征提取用户的行为信息。S2,根据业务场景对用户的行为信息进行评估,为用户打上多个维度的用户标签以构建用户画像,其中,每个用户标签所对应的标签权重通过将标签主观重要程度和标签客观重要程度进行融合得到。在本专利技术的实施例中,当前为用户打上的用户标签与用户的当前行为信息相对应。其中,多个维度的用户标签包括用户基础属性、用户活跃情况、用户资源偏好、用户行为偏好、资源访问结果、用户可疑性。在本专利技术的一个实施例中,上述的六个维度的用户标签可作为一级标签,在整个用户标签体系中,还可包括二级标签和三级标签,每个用户标签具有对应的标签类型,具体见表1。表1如表1,用户标签可分为事实标签、模型标签和预测标签,标签权重计算主要针对模型标签和预测标签。事实标签可直接从原始数据中获取;模型标签指没有直接对应数据,需要人为定义规则,经规则计算得到标签实例;预测标签指参考已有事实数据,通过建模来预测用户的行为或偏好。其中,模型标签和预测标签的生成方法包括统计方法、文本挖掘算法、相似度计算方法、分类聚类算法、机器学习预测算法等。在本专利技术本文档来自技高网
...

【技术保护点】
1.一种大数据访问授权方法,其特征在于,包括以下步骤:提取大数据平台认证用户的行为信息;根据业务场景对所述用户的行为信息进行评估,为所述用户打上多个维度的用户标签以构建用户画像,其中,每个所述用户标签所对应的标签权重通过将标签主观重要程度和标签客观重要程度进行融合得到;每间隔预设时间更新所述用户画像,实现用户标签及其标签权重的动态更新;根据更新后的用户画像对所述用户进行访问授权。

【技术特征摘要】
1.一种大数据访问授权方法,其特征在于,包括以下步骤:提取大数据平台认证用户的行为信息;根据业务场景对所述用户的行为信息进行评估,为所述用户打上多个维度的用户标签以构建用户画像,其中,每个所述用户标签所对应的标签权重通过将标签主观重要程度和标签客观重要程度进行融合得到;每间隔预设时间更新所述用户画像,实现用户标签及其标签权重的动态更新;根据更新后的用户画像对所述用户进行访问授权。2.根据权利要求1所述的大数据访问授权方法,其特征在于,所述大数据平台为Hadoop平台,通过Hadoop生态圈组件,结合资源属性特征提取所述用户的行为信息。3.根据权利要求2所述的大数据访问授权方法,其特征在于,所述多个维度的用户标签包括用户基础属性、用户活跃情况、用户资源偏好、用户行为偏好、资源访问结果、用户可疑性。4.根据权利要求1所述的大数据访问授权方法,其特征在于,所述标签主观重要程度通过层次分析法进行评估,通过对每个所述用户标签的主观打分构建成对比较矩阵,然后计算矩阵特征向量得出。5.根据权利要求1所述的大数据访问授权方法,其特征在于,所述标签客观重要程度通过将用户的最新标签与历史标签相比较得出。6.根据权利要求2所述的大数据访问授权方法,其特征在于,其中,通过用户活跃情况和用户可疑性判断用户异常状...

【专利技术属性】
技术研发人员:李佳慧赵刚王帅
申请(专利权)人:北京信息科技大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1