当前位置: 首页 > 专利查询>江苏大学专利>正文

一种基于遗传算法的隐私保护关联规则挖掘方法技术

技术编号:5997830 阅读:380 留言:0更新日期:2012-04-11 18:40
?本发明专利技术公开一种基于遗传算法的隐私保护关联规则挖掘方法,包括预处理、记录编码、生成初始种群、构造种群中记录所对应项目适应度函数、个体的选择、个体间的单点交叉运算、变异个体的基本位变异运算、满足两条件算法结束;可以有效地保护敏感关联规则,确保被挖掘的数据库中不再包含敏感关联规则,且不会产生幽灵规则;尽可能地保留原数据库中的非敏感关联规则,克服了现有算法是在定性规则而非定量指标的引导下进行且其实际效果只有等算法执行完后才能得以验证和确认且如果效果不够理想必须多次重复执行等不足。?

【技术实现步骤摘要】

本专利技术属于数据挖掘中的隐私保护技术,具体涉及一种关联规则挖掘中敏感关联 规则的隐藏方法。
技术介绍
随着网络、数据库存储以及高性能处理器等技术的飞速发展,数据库中存储的数 据呈爆炸式增长,导致出现了”数据爆炸,知识贫乏”的现象。另外,20世纪下半叶发展起来 的专家系统,也遇到了 “知识获取”这一瓶颈问题。在此背景下,强有力数据分析工具的需 求推动了数据挖掘技术的产生。数据挖掘技术可以帮助人们从大量的数据中智能地、自动 地抽取隐含的、事先未知的,具有潜在价值的知识或信息,它不仅被许多研究人员看作是数 据库系统和机器学习等方面的一个重要研究课题,而且被许多产业界人士看作是一个能带 来巨大回报的重要领域,从数据库中发现出来的规则和知识可以用在信息管理、查询响应、 决策支持、过程控制等诸多方面。任何事情都有其两面性,数据挖掘也不例外,在数据挖掘产生巨大财富的同时,随 之产生的就是隐私泄露的问题,对数据挖掘所获知识或规则的外泄而产生的不适当应用将 会给个人隐私带来威胁,如公司优质客户的行为特征等等,从而导致相关机构或个人不愿 提供真实可靠的原始数据。由此可见,如果数据使用者不对相关规则进本文档来自技高网...

【技术保护点】
一种基于遗传算法的隐私保护关联规则挖掘方法,其特征是包括如下步骤;1)预处理:删除原始数据库D中不支持频繁项目集X Y的记录,对原始数据库D中支持频繁项目集XY的记录t,首先删除集合tY中的一个项目,其次修改敏感关联规则X→Y的支持度sup(X→Y)=(count(X∪Y)-1)/|D|和置信度conf(X→Y)=(count(X∪Y)-1)/count(X),count是相应的支持数,最后删除记录t;若处理后的数据库D’的支持度或置信度小于用户给定的相应阈值,则整个隐私保护关联规则挖掘过程结束,反之则转入第2)步;2)记录编码:设置k位二进制数,数据库D’中第一条记录的编码为00……000、...

【技术特征摘要】

【专利技术属性】
技术研发人员:朱玉全陈耿孙蕾欧吉顺
申请(专利权)人:江苏大学
类型:发明
国别省市:32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1