【技术实现步骤摘要】
一种基于数据密度竞争学习的半监督模式分类方法
本专利技术涉及模式识别和分类,尤其是涉及一种基于数据密度竞争学习的半监督模式分类方法。
技术介绍
在模式识别和分类领域,监督学习是在已知类别的数据样本基础上对机器学习分类器进行调整,使得分类器输出达到所需性能的过程。监督学习方法通常要求已知类别的数据样本量多于需要分类或预测的未知类别的数据样本。在实际应用中,数据样本有时难以通过人工标注已知类别,或者进行人工标注类别的成本太高,使得监督学习方法的分类效果较差。而无监督学习方法虽然不要求已知类别的数据样本,但是由于缺乏先验知识,往往对未知样本的归类划分不明确,达不到所需的预测效果。因此,在仅有少量的人工标注已知类别样本情况下,并且需要对大量未知类别的数据样本进行预测或分类的应用场景,监督学习分类方法因为已知可学习的样本数量太少而效果不佳,无监督学习又因为无法利用已知类别样本的信息进行更好的预测效果。半监督方法同时具备了无监督学习对数据先验知识的依赖性,又拥有监督学习对已知类别数据样本的学习能力,可以在少量已知类别数据样本的条 ...
【技术保护点】
1.一种基于数据密度竞争学习的半监督模式分类方法,其特征在于包括以下步骤:/n1)检测备选种子点并筛选出获胜种子点;/n2)以获胜种子点作为初始质心进行K-means多原型聚类,并且结合半监督学习方法,由K近邻算法将多原型聚类结果进行分类;/n3)检测备选边界点并筛选出获胜边界点;/n4)基于获胜边界点画出决策分类边界线。/n
【技术特征摘要】
1.一种基于数据密度竞争学习的半监督模式分类方法,其特征在于包括以下步骤:
1)检测备选种子点并筛选出获胜种子点;
2)以获胜种子点作为初始质心进行K-means多原型聚类,并且结合半监督学习方法,由K近邻算法将多原型聚类结果进行分类;
3)检测备选边界点并筛选出获胜边界点;
4)基于获胜边界点画出决策分类边界线。
2.如权利要求1所述一种基于数据密度竞争学习的半监督模式分类方法,其特征在于在步骤1)中,所述检测备选种子点并筛选出获胜种子点的具体步骤为:
(1)获得一个L维的具有N个元素的数据集
(2)设置密度阈值参数δ,检测备选种子点;
(3)从备选种子集中筛选出种子点,得到获胜种子集
3.如权利要求2所述一种基于数据密度竞争学习的半监督模式分类方法,其特征在于在步骤1)第(2)部分中,所述设置密度阈值参数δ,检测备选种子点的具体步骤为:
①给定半径r,在L2范数下定义示性函数I(xm,xn,r)表示两个数据点的靠近程度:
其中,
②由上述示性函数I(xm,xn,r)计算xm的密度,即:
③设置密度阈值参数δ,备选种子点xm由下述示性函数给出:
即得到备选种子集及xm在半径r范围内的所有备选种子,即
4.如权利要求2所述一种基于数据密度竞争学习的半监督模式分类方法,其特征在于在步骤1)第(3)部分中,所述从备选种子集中筛选出种子点,得到获胜种子集的具体步骤为:
①初始化种子集,设为空集,即
②在竞争学习的第j次迭代中,挑选备选种子集中密度最大的点作为获胜种子点
③第j+1次迭代中种子集更新为:
④同时,第j+1次迭代中备选种子集更新为:其中,为的补集;
⑤重复步骤②直至备选集为空集,即得到最终获胜种子集
5.如权利要求1所述一种基于数据密度竞争学习的半监督模式分类方法,其特征在于在步骤2)中,所述以获胜种子点作为初始质心进行K-means多原型聚类,并且结合半监督学习方法,由K近邻算法将多原型聚类结果进行分类的具体步骤为:
(1)以获胜种子点作为初始质心进行K-means多原型聚类;
(2)通过半监督学习方法,选取已知类别标签的数据样本作为训练集;
(3)由k近邻算法将多原型聚类结果进行分类,得到最终的分类结果。
6.如权利要求5所述一种基于数据密度竞争学习的半监督模式分类方法,其特征在于在步骤2)第(1)部分...
【专利技术属性】
技术研发人员:吴云峰,高庭暄,刘一萱,
申请(专利权)人:厦门大学,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。