基于人工免疫网络的遥感影像关联规则挖掘方法技术

技术编号:4024538 阅读:262 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供的是一种基于人工免疫网络的遥感影像关联规则挖掘方法。用于从遥感影像中挖掘潜在的规律和模式。使用了人工免疫系统中的基于分区记忆模式的人工独特型网络,在结构上将免疫网络的记忆抗体划分为特异记忆抗体区和自由记忆抗体区。在遥感影像关联规则挖掘过程中将要挖掘的关联规则作为抗体,将用户感兴趣的属性值作为抗原,并基于上述分区,在初次免疫响应过程中实现网络的搭建和训练,在二次免疫响应过程中实现信息提取;最后根据领域知识对从遥感影像中挖掘出的关联规则进行优化。本发明专利技术充分利用了记忆抗体亚动力的自组织、自学习、自适应、全局优化作用等特性加快了关联规则的挖掘速度,同时具有较强的鲁棒性和有效的全局搜索能力。

【技术实现步骤摘要】

本专利技术涉及的是一种遥感影像处理技术,特别涉及一种遥感影像多维关联规则挖 掘方法。
技术介绍
随着遥感数据获取技术的迅速发展,遥感数据及其数据产品实现了长时期积 累。遥感数据处理技术滞后于数据获取技术的现状,已经满足不了国土资源大调查、生 态环境治理、防灾减灾等国家重大需求和地学图谱、碳循环等科学研究的需求。因此,开 发从大量遥感数据中挖掘有用信息的技术,已经迫在眉睫。遥感影像数据挖掘(remote sensingimage data mining,简称RESIM)技术,是用数据图像分析技术、模式识别、人工智 能、地理信息系统、空间数据挖掘的相关理论和技术来发现和挖掘隐含在遥感影像中信息 的技术,是图像数据挖掘技术在遥感领域的一个应用。关联规则的挖掘是数据挖掘领域中的一个重要研究方向,它通过挖掘数据库中的 数据项集之间的某种潜在关系,从而在大量数据中发现一些潜在和有趣的关联关系,以此 为依据来帮助决策者作出合理、适当的决定。对遥感影像进行关联规则挖掘,可以将每一 个图像看作一个事务或将图像中每一个对象看作一个事务,从中找出不同图像间或不同对 象间出现频率高的模式。遥感影像中中往往会涉及到两个以上因子相互作用,这类问题可 以归结为多维关联或多因子关联,求解多维关联之间的规律或模式是多维关联规则挖掘问 题。最经典的关联规则挖掘是Apriori算法。Apriori算法作为最经典的布尔关联规则挖掘算法由Agrawal等在1994年提 出,这是一个基于两阶段频集思想的方法,将关联规则挖掘算法的设计可以分解为两个 子问题1.找到所有支持度大于最小支持度的项集(Item Set),这些项集称为频繁项集 (Frequentltem Set) ;2.使用第1步找到的频集产生期望的规则。Apriori算法利用候选 项集和频集的相互作用,得到了全部频集,并通过对候选项集进行剪枝,大大地减少了候选 项集的尺寸,获得了令人满意的结果。然而,当面对挖掘对象具有繁多的频繁模式或者用户 给定的最小支持度较低时,Apriori算法仍然有可能因为如下两个方面的巨大开销而面临 困境1.在处理候选项集方面,如果算法得到了大量的频繁1-项集,那么,在产生候选 2-项集时,会遇到大量候选2-项集难以处理的情况。例如假设算法得到的频繁1-项集 的数量是104,则根据Apriori算法,会产生超过107个候选2-项集,由于剪枝对候选2-项 集根本不起作用,所以这些候选项集都需要检验。此外,在面对频繁模式的尺寸较大时,同 样会产生大量的候选项集需要检验。所以,在有大量候选项集产生的情况下,Apriori算法 效率不理想。2. Apriori算法采用的模式匹配方式,在检测大量的候选项集,特别是在挖掘长模 式时,对数据库的重复扫描非常多,大量的时间消耗在内存与数据库中的数据的交换上。有 关文献:Jiawei Han, Micheline Kamber. Data Mining Concepts andTechniques. John A.Richards, Xiuping Jia. Remote Sensing Didital Image Analysis.综上所述,现有的遥感影像关联规则挖掘方法中的Apriori算法需要很大的计算 开销,而且可能产生庞大的候选集,执行效率偏低,不适合用作海量数据的分析方法。近年来兴起的人工免疫系统AIS(Artificial Immune System)的研究是一个崭新 的应用领域,而且人工免疫系统发展迅速,成为智能系统中继模糊逻辑、神经网络、遗传算 法之后的又一研究热点。人们基于生物免疫原理提出了多种人工免疫模型和算法,并应用 于自动控制、故障诊断、优化计算、模式识别、机器学习、数据分析等领域。人工独特型网络 理论主要与抗体有关,认为抗体具有能够识别抗原的抗体决定位和能够被其他抗体识别的 抗原决定位,即独特位。抗体之间通过独特位彼此沟通、互相联系、互相制约形成网络结构。 网络学说立足于抗体分子的双重性,它既可以与特定抗原结合返回抗体作用,又借助于自 身的独特型抗原决定簇引发免疫反应。人工免疫系统曾被应用到遥感影像分类技术当中,申请号为200610019506的专 利申请中应用该算法实现了一种遥感影像地物监督分类方法。该专利使用了资源限制型人 工免疫网络,随机选择样本抗原,得到各类初始人工识别球种群和初始抗体记忆库,对所有 抗原样本进行人工免疫训练得到优化后的抗体记忆库,其中包含了克隆变异的过程,最终 利用距离判定像元归属的类别。近几年,在事务数据库的关联规则挖掘中人工免疫系统的 优势也逐渐被认识到,朱玉、张虹、孔令东在《基于人工免疫的多维关联规则挖掘及其应用 研究》中提出了一种基于人工免疫的多维关联规则挖掘算法。算法充分利用了人工免疫的 记忆特性,把挖掘的关联规则存入记忆库,加快了多维关联规则的挖掘速度。结果表明,该 算法应用于煤与瓦斯突出预测中,具有较好的鲁棒性,能快速、有效地进行全局优化搜索, 在多维关联规则的挖掘中具有可行性和高效性。然而在遥感影像关联规则挖掘中,针对遥 感影像数据的种种特性,人工免疫系统还没有得到充分的利用。如何借鉴人工免疫系统,提 供高效的人工免疫遥感影像关联规则挖掘方法,挖掘出遥感影像中潜在的规律和模式,是 目前遥感影像分析领域亟待解决的问题。
技术实现思路
本专利技术的目的在于提供一种能加快关联规则的挖掘速度,具有较强的鲁棒性和有 效的全局搜索能力的。本专利技术的目的是这样实现的步骤1从遥感图像中对采样像素点提取待分析的各种属性数据;步骤2对提取的属性数据进行分割;步骤3将分割后的图像数据转化为事务数据库;步骤4把要挖掘的关联规则作为抗体,将用户感兴趣的属性值作为抗原,对抗体 抗原编码,采用实数编码方式;抗原分两种情况作用于RAIN网络内的抗体;初次免疫响应和二次免疫响应;初次免疫效应步骤5设定RAIN网络规模,免疫激励阈值及终止条件最大迭代次数;步骤6搭建并初始化RAIN网络,设置特异记忆抗体区和自由记忆抗体区;步骤7对所有抗原进行人工免疫训练,得到所有样区的记忆抗体数据库,对所有 抗原的训练包括以下步骤5)计算抗原到RAIN网络中每个抗体的激励水平,从初始抗体记忆库中找到与该 抗原最匹配的抗体;6)对最匹配的抗体进行克隆,得到克隆抗体种群,对其中的克隆抗体进行变异,将 变异后的抗体进行抑制处理;7)对于经过2)的抗体种群,判断该种群的平均刺激水平是否达到设定的激励水 平,如果达到则进入4),否则对该种群进行克隆变异操作,从步骤1)开始重新计算,直到满 足阈值条件;8)从抗体种群中选择对抗原刺激水平最大的细胞作为候选记忆抗体,然后比较候 选记忆抗体与步骤6中得到的自由记忆抗体的刺激水平大小,由两者激励水平最高者来进 化特异记忆抗体区中激励水平最低的抗体;步骤8再次建立RAIN网络中所有抗体之间的连接;步骤9测试第i个样本抗原训练是否完成;完成则复位自由记忆抗体区,否则返回 步骤7 ;步骤10测试所有样本训练是否完成,完成则输出RAIN网络,否则返回步骤7 ;二次免疫效应步骤11设定RAIN网络各特异记忆区激活的阈值;步骤12抗原作用于RAIN网络,计算网络中各个特异记忆抗体所受的激励本文档来自技高网
...

【技术保护点】
一种基于人工免疫网络的遥感影像关联规则挖掘方法,其特征是:步骤1从遥感图像中对采样像素点提取待分析的各种属性数据;步骤2对提取的属性数据进行分割;步骤3将分割后的图像数据转化为事务数据库;步骤4把要挖掘的关联规则作为抗体,将用户感兴趣的属性值作为抗原,对抗体抗原编码,采用实数编码方式;抗原分两种情况作用于RAIN网络内的抗体;初次免疫响应和二次免疫响应;初次免疫效应:步骤5设定RAIN网络规模,免疫激励阈值及终止条件最大迭代次数;步骤6搭建并初始化RAIN网络,设置特异记忆抗体区和自由记忆抗体区;步骤7对所有抗原进行人工免疫训练,得到所有样区的记忆抗体数据库,对所有抗原的训练包括以下步骤:1)计算抗原到RAIN网络中每个抗体的激励水平,从初始抗体记忆库中找到与该抗原最匹配的抗体;2)对最匹配的抗体进行克隆,得到克隆抗体种群,对其中的克隆抗体进行变异,将变异后的抗体进行抑制处理;3)对于经过2)的抗体种群,判断该种群的平均刺激水平是否达到设定的激励水平,如果达到则进入4),否则对该种群进行克隆变异操作,从步骤1)开始重新计算,直到满足阈值条件;4)从抗体种群中选择对抗原刺激水平最大的细胞作为候选记忆抗体,然后比较候选记忆抗体与步骤6中得到的自由记忆抗体的刺激水平大小,由两者激励水平最高者来进化特异记忆抗体区中激励水平最低的抗体;步骤8再次建立RAIN网络中所有抗体之间的连接;步骤9测试第i个样本抗原训练是否完成;完成则复位自由记忆抗体区,否则返回步骤7;步骤10测试所有样本训练是否完成,完成则输出RAIN网络,否则返回步骤7;二次免疫效应:步骤11设定RAIN网络各特异记忆区激活的阈值;步骤12抗原作用于RAIN网络,计算网络中各个特异记忆抗体所受的激励;步骤13比较激励水平与特异记忆区激活的阈值,如较激励水平大于阈值则该类特异记忆抗体区被激活,获得参与识别该抗原的资格;具备识别资格的特异记忆抗体竞争识别抗原,受激励最大者,识别抗原成功;步骤14输出识别结果各类的特异记忆区的激励水平;步骤15测试二次免疫响应是否完成,完成则保存识别结果和特异记忆区的激励水平,否则返回步骤12;步骤16若终止条件满足,则把编码还原为规则,对关联规则进行提取和优化,结束挖掘过程,否则返回步骤4。...

【技术特征摘要】

【专利技术属性】
技术研发人员:杜航原郝燕玲刘厂高峰张振兴沈志峰
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:93[中国|哈尔滨]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利