大数据环境下基于限定模糊规则的多分类系统及方法技术方案

技术编号:17516686 阅读:36 留言:0更新日期:2018-03-21 01:15
本发明专利技术涉及一种大数据环境下基于限定模糊规则的多分类系统及方法,属于大数据分类领域。该系统包括模糊产生器、模糊推理机、基础知识库和解模糊器;模糊产生器将输入论域U确定的点一一映射为U上的模糊集合;基础知识库由若干的模糊规则“如果‑则”规则组成,若干模糊规则分为若干类,每一个类的模糊规则由数据规则和基本规则组成;模糊推理机在模糊逻辑原理的基础上,利用模糊规则将论域U上的模糊集合与输出论域V上的模糊集合对应起来;模糊消除器将V上的模糊集合一一映射为V上确定的点。本发明专利技术极大的提升了分类效率,同时通过对确定规则正反规则的补充,也减少了因为模糊操作带来的误差,也保证了分类准确率。

Multi classification system and method based on limited fuzzy rules in large data environment

The invention relates to a multi classification system and method based on limited fuzzy rules in large data environment, which belongs to the field of large data classification. The system includes fuzzy generator, fuzzy inference machine, knowledge base and defuzzificator; fuzzy input domain U generator will determine the point mapping for the fuzzy U based on knowledge base set; fuzzy rules \if is composed of several rules, some fuzzy rules are divided into several categories, each fuzzy rule a class consists of data rules and basic rules; fuzzy reasoning based on fuzzy logic principle, using fuzzy rules of fuzzy domain on U fuzzy sets and output on the V set up the corresponding fuzzy; fuzzy Canceller on V set mapping identified as V points. The invention greatly improves the classification efficiency, and reduces the error caused by fuzzy operation, and ensures the accuracy of classification by supplementing the positive and negative rules of rules.

【技术实现步骤摘要】
大数据环境下基于限定模糊规则的多分类系统及方法
本专利技术属于大数据分类领域,涉及大数据环境下基于限定模糊规则的多分类系统及方法。
技术介绍
近些年,随着大数据时代的到来,人们迫切需要研究出更加方便有效的工具对收集到的海量信息进行快速准确的分类,以便从中提取符合需要的、简洁的、精炼的、可理解的知识。数据是企业运营中积累的宝贵财富,存在于操作环境和分析环境中。操作环境支撑基本的业务运作,分析环境在整合、提炼操作环境数据的基础上支撑企业的决策分析需求,因此数据对于企业运营支撑和决策分析有着不可替代的作用。大数据大财富和大价值的获取,也随着数据量大的原因,变得更难以处理和发现。分类是一种常见的海量数据知识抽取的方法,目前关于这方面的研究也取得了很大的进步。现有的分类算法有很多种,比较常用的有KNN(K-nearestneighbor)、NativeBayes、NerualNet、SVM(Supportvectormachine)、LLSF(linearleastsquarefit)以及最近变得常用的模糊规则分类等等。模糊分类器能够利用简单语言表达的模糊规则,克服了基于符号规则或硬规则分类器的缺陷,因此引起相关研究人员的关注。针对这些算法处理大规模数据时存在的问题,国内外已经进行了很多相关方面的研究。石绍应和王小谟提出了一种规则数确定的自适应模糊分类器。该分类器由多个用于区分出一种类别的模糊推理机组成,每个模糊推理机包含两条模糊逻辑“如果--则”规则,分类器的总规则数由待分类模式的类别数确定,分类器采用误差反向传播学习算法进行学习训练,可以避免因输入空间维度增加而出现的“维度灾难”。该分类模型具有较强的学习能力、分类识别能力,以及抗干扰、抗数据污染能力。龚静和黄欣阳等提出一种基于改进模糊语法增量式算法的文本分类方法。该算法采用增量模型将文本片段转换到底层框架中,形成模糊语法,最后运用模糊联合整合转换成更加一般的转换形式。该算法性能较平稳,数据的尺寸影响更小,具有较低的模型重新训练时间。樊雷和雷英杰等人提出了基于弱贪婪策略的快速直觉模糊核匹配追踪方法。针对现有直觉模糊核匹配追踪算法采用贪婪算法搜索最优基函数而导致学习时间过长的局限性,基于弱贪婪策略,提出一种随机直觉模糊核匹配追踪算法。该方法在保持识别精度相当的情况下,有效缩短了一次匹配追踪时间,计算效率明显提高,且所得模型具有稀疏性好、泛化能力高等优点。徐明亮和王士同提出了一种构建TSK(Takagi-Sugeno-Kang)分类器的算法。该算法结合模糊(C+P)均值聚类(FCPM)算法和SP-V-支持向量机(SVM)分类算法,不仅改善了系统的泛化性能,还使系统具有模糊规则自适应约简功能,使得系统更为紧凑。规则数确定的自适应模糊分类器能够解决用模糊规则进行海量数据分类“维度灾难”的问题,而且也是效果最好的模糊规则分类方法之一。而且规则数确定的自适应模糊分类器具有模糊分类器处理现实世界柔性信息的能力,非常适于处理现在的互联网海量信息。下文称规则数确定的自适应模糊分类器为确定规则算法。确定规则算法的不足之处是效率不是很理想,训练的时间比较长,对于大数据模型的建立需要花费很大时间开销;其次,确定规则算法对模糊规则的应用有待进一步延伸。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种大数据环境下基于限定模糊规则的多分类系统及方法,不仅分类规则应用模糊规则,分类算法的操作上也应用模糊的方式进行处理,极大的提升了分类效率,同时通过对确定规则正反规则的补充,也减少了因为模糊操作带来的误差。为达到上述目的,本专利技术提供如下技术方案:大数据环境下基于限定模糊规则的多分类系统,该系统包括模糊产生器、模糊推理机、基础知识库和解模糊器;模糊产生器将输入论域U确定的点一一映射为U上的模糊集合;基础知识库由若干的模糊规则“如果-则”规则组成,若干模糊规则分为若干类,每一个类的模糊规则由数据规则和基本规则组成;模糊推理机在模糊逻辑原理的基础上,利用模糊规则将论域U上的模糊集合与输出论域V上的模糊集合对应起来;模糊消除器将V上的模糊集合一一映射为V上确定的点。进一步,所述“如果-则”规则为:Rk:如果x1为且...,且xn为则y为Gk式中,为上的模糊集合,为上的模糊集合,x=(x1,...,xn)T∈U1×...×Un为语言变量,y∈V为语言变量;k=1,2,...,M,M为模糊规则库中规则总数;借鉴于两类模糊规则问题的对立,在所述系统中每一个对应的V都有两类三种规则,一类是基本规则,另一类是数据规则,数据规则又分为支持规则和反对规则,抽象表达为:R(k,i):如果x1为f1的且...,且xn为fn的则y为w的Gk式中,R(k,i)表示一类规则的描述,若i=0,表示这条规则属于数据规则中的反对规则,描述对样本x属于k这个类别的反对程度;若i=1,则表示这条规则属于数据规则中的支持规则,描述对样本x属于k这个类别的的支持程度;若i∈r,r为限定的基本规则集合,表示这条规则属于基本规则;fi中i的取值为1,2,……,n,表示样本每个属性对规则对应隶属程度,fi的取值范围为0到1,在反对规则中,fi取0表示反对规则的第i个属性对样本的第i个属性的反对程度的不确定,fi的其他取值表示表示反对规则的第i个属性对样本的第i个属性不同程度的反对属性值;同样,在基本规则中,所有的fi值都取1,要求样本与规则完全符合;w表示待分类样本属于和不属于某一个类别的权重,取值范围为0到1,基本规则中取值固定为1;数据规则为基本规则限定在极少的数量内,在获得不错的准确率的情况下,降低规则的数量;基本规则尽可能少,基本规则确定样本属于某一个类别。大数据环境下基于限定模糊规则的多分类方法,该方法步骤为:在经典推理时运用模糊规则,即在p→q的推理过程中,使用模糊规则IF-THEN取代p、q命题,用模糊补、模糊并、模糊交取代、∨、∧算子,则模糊规则为:IF<FP1>THEN<FP2>假设FP1是一个定义在U=U1×…×Un上的模糊关系,FP2是一个定义在V=V1×…×Vn上的模糊关系,向量x和y分别是U和V上的语言变量;所述模糊规则根据选取的不同模糊算子表示Dienes-Rescher含义;模糊IF-THEN规则IF<FP1>THEN<FP2>,解释为U×V中的一个模糊关系QD,模糊补为模糊并为μA∪B(x)=max[μA(x),μB(x)],模糊推理隶属度函数为是模糊补,表示待分类样本属于一个类别补运算操作,模糊补表示一个样本不属于某一个类别的程度;μA∪B(x)是模糊并,表示一个样本同时属于两个类别时,让样本属于隶属度函数更大的类别,让样本的模糊程度更轻;表示模糊推理,是在模糊补和模糊并μA∪B(x)的基础上经典推理p→q的等价形式的模糊表示形式,用于进行模糊推理。本专利技术的有益效果在于:本专利技术极大的提升了分类效率,同时通过对确定规则正反规则的补充,也减少了因为模糊操作带来的误差,也保证了分类准确率。附图说明为了使本专利技术的目的、技术方案和有益效果更加清楚,本专利技术提供如下附图进行说明:图1为模糊分类系统;图2为本文档来自技高网
...
大数据环境下基于限定模糊规则的多分类系统及方法

【技术保护点】
大数据环境下基于限定模糊规则的多分类系统,其特征在于:该系统包括模糊产生器、模糊推理机、基础知识库和解模糊器;模糊产生器将输入论域U确定的点一一映射为U上的模糊集合;基础知识库由若干的模糊规则“如果‑则”规则组成,若干模糊规则分为若干类,每一个类的模糊规则由数据规则和基本规则组成;模糊推理机在模糊逻辑原理的基础上,利用模糊规则将论域U上的模糊集合与输出论域V上的模糊集合对应起来;模糊消除器将V上的模糊集合一一映射为V上确定的点。

【技术特征摘要】
1.大数据环境下基于限定模糊规则的多分类系统,其特征在于:该系统包括模糊产生器、模糊推理机、基础知识库和解模糊器;模糊产生器将输入论域U确定的点一一映射为U上的模糊集合;基础知识库由若干的模糊规则“如果-则”规则组成,若干模糊规则分为若干类,每一个类的模糊规则由数据规则和基本规则组成;模糊推理机在模糊逻辑原理的基础上,利用模糊规则将论域U上的模糊集合与输出论域V上的模糊集合对应起来;模糊消除器将V上的模糊集合一一映射为V上确定的点。2.根据权利要求1所述的大数据环境下基于限定模糊规则的多分类系统,其特征在于:所述“如果-则”规则为:Rk:如果x1为且...,且xn为则y为Gk式中,为上的模糊集合,为上的模糊集合,x=(x1,...,xn)T∈U1×...×Un为语言变量,y∈V为语言变量;k=1,2,...,M,M为模糊规则库中规则总数;借鉴于两类模糊规则问题的对立,在所述系统中每一个对应的V都有两类三种规则,一类是基本规则,另一类是数据规则,数据规则又分为支持规则和反对规则,抽象表达为:R(k,i):如果x1为f1的且...,且xn为fn的则y为w的Gk式中,R(k,i)表示一类规则的描述,若i=0,表示这条规则属于数据规则中的反对规则,描述对样本x属于k这个类别的反对程度;若i=1,则表示这条规则属于数据规则中的支持规则,描述对样本x属于k这个类别的的支持程度;若i∈r,r为限定的基本规则集合,表示这条规则属于基本规则;fi中i的取值为1,2,……,n,表示样本每个属性对规则对应隶属程度,fi的取值范围为0到1,在反对规则中,fi取0表示反对规则的第i个属性对样本的第i个属性的反对程度的不确定,fi...

【专利技术属性】
技术研发人员:熊安萍蒋亚雄祝清意段杭彪丁世旺
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1