The invention belongs to the technical field of privacy protection, in particular to a method for protecting sensitive information of enterprise hardware facilities in social media. The invention firstly established the hardware infrastructure information database, and then through the construction of hardware classification model and hardware model matching algorithm to determine the description of information involved in social media hardware model; finally get the hardware model to shield or replace the hardware description keywords may have information in the disclosure of sensitive information. The invention can process different key words according to different keyword sensitive levels, and has better expansibility.
【技术实现步骤摘要】
一种社交媒体中企业硬件设施敏感信息防护方法
本专利技术涉及一种社交媒体中企业硬件设施敏感信息防护方法,属于隐私保护
技术介绍
伴随着微博、网络论坛等传统的社交媒体以及微信、Facebook、Twitter等新兴的社交媒体的出现,人们进入了社交媒体时代。社交媒体的快速兴起加速了信息的流动,使得人与人之间的沟通变得越来越便捷。但不可忽视的是,社交媒体的广泛使用也带来了安全上的隐患,社交媒体用户也在有意或无意地对企业或机构的机密敏感信息造成了威胁,这些信息如果被商业机构或一些不法分子非善意获取、整合和利用,就会导致个人或机构隐私泄露[1]。移动设备用户可以很方便地依靠基于位置的服务获得自己的位置和相关的服务信息。尽管基于位置的服务为用户提供了极大的方便,但基于位置的服务需要先获取移动用户的位置信息才能对用户提供相应的服务,而基于位置的服务系统并不能保证服务器不泄露或非法使用用户的位置信息。因此基于位置的服务给用户的位置隐私保护带来了极大的挑战[2]。另外随着近年来大数据技术的兴起,基于大数据技术的隐私保护技术也越来越多,但总体上来说,当前国内外针对大数据安全与隐私保护的相关研究还不充分,只有通过技术手段与相关政策法规等相结合,才能更好地解决大数据安全与隐私保护问题[3]。随着互联网的广泛应用,国内外关于隐私保护或商业机密保护的研究也越来越多。隐私保护的主要研究方向包括通用的隐私保护技术、面向数据挖掘的隐私保护技术、基于隐私保护的数据发布原则、隐私保护算法等。通用的隐私保护技术致力于在较低应用层次上保护数据的隐私,一般通过引入统计模型和概率模型来实现;面 ...
【技术保护点】
一种社交媒体中企业硬件设施敏感信息防护方法,其特征在于,具体步骤如下:步骤一、构建模型(1)硬件信息库的构建获取硬件信息,提取包括硬件大类、厂家和型号在内的多个层级、属性和属性值信息,组织成XML层次结构,构建硬件信息库;(2)对硬件信息库中的硬件描述信息进行中文分词;(3)构建硬件分类模型和硬件型号匹配算法对硬件信息库中的硬件描述信息进行分词后,首先提取大类的特征信息,再在大类分类的基础上,提取厂家的特征信息,构建厂家分类模型;最后通过大类和厂家的类别信息,构建硬件型号匹配算法,确定硬件的型号;(4)构建关键词屏蔽替换模型针对每一个硬件大类,对硬件描述信息中出现的属性关键词进行敏感级别划分,并对不同敏感级别的关键词采取不同的处理方式,构建关键词屏蔽替换模型;其中,敏感级别划分为0、1、2、3和4;对于敏感级别为0的关键词不作处理,对于敏感级别为4的关键词直接屏蔽,对于敏感级别为1、2、3的关键词通过关键词语义树进行处理;所述关键词语义树由硬件信息库中不同层级上的关键词按照XML结构关系构建;关键词语义树有四层,基于关键词语义树的替换策略如下:对于敏感级别为1的关键词,采用其父节点进行 ...
【技术特征摘要】
1.一种社交媒体中企业硬件设施敏感信息防护方法,其特征在于,具体步骤如下:步骤一、构建模型(1)硬件信息库的构建获取硬件信息,提取包括硬件大类、厂家和型号在内的多个层级、属性和属性值信息,组织成XML层次结构,构建硬件信息库;(2)对硬件信息库中的硬件描述信息进行中文分词;(3)构建硬件分类模型和硬件型号匹配算法对硬件信息库中的硬件描述信息进行分词后,首先提取大类的特征信息,再在大类分类的基础上,提取厂家的特征信息,构建厂家分类模型;最后通过大类和厂家的类别信息,构建硬件型号匹配算法,确定硬件的型号;(4)构建关键词屏蔽替换模型针对每一个硬件大类,对硬件描述信息中出现的属性关键词进行敏感级别划分,并对不同敏感级别的关键词采取不同的处理方式,构建关键词屏蔽替换模型;其中,敏感级别划分为0、1、2、3和4;对于敏感级别为0的关键词不作处理,对于敏感级别为4的关键词直接屏蔽,对于敏感级别为1、2、3的关键词通过关键词语义树进行处理;所述关键词语义树由硬件信息库中不同层级上的关键词按照XML结构关系构建;关键词语义树有四层,基于关键词语义树的替换策略如下:对于敏感级别为1的关键词,采用其父节点进行替换;对于敏感级别为2的关键词,采用其父节点的父节点进行替换;对于敏感级别为3的关键词直接利用根节点进行替换;步骤二、检测防护对输入的社交媒体内容进行分词处理后,根据步骤一中的硬件分类模型和硬件型号匹配算法确定归属大类、归属厂家和归属型号;确定型号后,再利用步骤一中构建的关键词屏蔽替换模型,将分词后的社交媒体内容中的属性关键词,利用对应的敏感级别和处理方式执行相应的动作,即屏蔽、替换和不作处理。2.根据权利要求1所述的敏感信息防护方法,其特征在于,硬件分类模型中通过特征选择算法和分类算法对硬件大类和硬件厂家进行分类。3.根据权利要求2所述的敏感信息防护方法,其特征在于,进行硬件大类的分类时,特征选择算法采用改进的信息增益的方法,具体计算公式如下:其中,t是特征,c表示类别,k表示类别个数,dis(t)表示特征t在类间的分布,它是特征t出现的样本数和所有样本总数的比值,P(t)表示特征出现的概率,P(c)表示类别...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。