【技术实现步骤摘要】
本专利技术属于数据挖掘中的隐私保护技术,具体涉及一种关联规则挖掘中敏感关联 规则的隐藏方法。
技术介绍
随着网络、数据库存储以及高性能处理器等技术的飞速发展,数据库中存储的数 据呈爆炸式增长,导致出现了”数据爆炸,知识贫乏”的现象。另外,20世纪下半叶发展起来 的专家系统,也遇到了 “知识获取”这一瓶颈问题。在此背景下,强有力数据分析工具的需 求推动了数据挖掘技术的产生。数据挖掘技术可以帮助人们从大量的数据中智能地、自动 地抽取隐含的、事先未知的,具有潜在价值的知识或信息,它不仅被许多研究人员看作是数 据库系统和机器学习等方面的一个重要研究课题,而且被许多产业界人士看作是一个能带 来巨大回报的重要领域,从数据库中发现出来的规则和知识可以用在信息管理、查询响应、 决策支持、过程控制等诸多方面。任何事情都有其两面性,数据挖掘也不例外,在数据挖掘产生巨大财富的同时,随 之产生的就是隐私泄露的问题,对数据挖掘所获知识或规则的外泄而产生的不适当应用将 会给个人隐私带来威胁,如公司优质客户的行为特征等等,从而导致相关机构或个人不愿 提供真实可靠的原始数据。由此可见,如果数据 ...
【技术保护点】
一种基于遗传算法的隐私保护关联规则挖掘方法,其特征是包括如下步骤;1)预处理:删除原始数据库D中不支持频繁项目集X Y的记录,对原始数据库D中支持频繁项目集XY的记录t,首先删除集合tY中的一个项目,其次修改敏感关联规则X→Y的支持度sup(X→Y)=(count(X∪Y)-1)/|D|和置信度conf(X→Y)=(count(X∪Y)-1)/count(X),count是相应的支持数,最后删除记录t;若处理后的数据库D’的支持度或置信度小于用户给定的相应阈值,则整个隐私保护关联规则挖掘过程结束,反之则转入第2)步;2)记录编码:设置k位二进制数,数据库D’中第一条记录的编 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。