A method of sample data updating based on SVM is presented. The method includes: obtaining sample data and dividing sample data into at least two classification sets in feature space (S101); determining the maximum convex hull samples in each classification set separately. The largest convex hull samples are used to define the first convex hull space in feature space, and the first convex hull space can accommodate the described. Sample data (S102) other than the maximum convex hull sample in the classification set; selective updating of the maximum convex hull sample (S103) based on the location relationship between the data points to be added or deleted and the maximum convex hull sample; and selective updating of the classification hyperplane (S104) based on the updating of the maximum convex hull sample. By selectively updating the maximum convex hull samples and selectively updating the classification hyperplane according to the position relationship between the data points to be added or deleted and the maximum convex hull samples, the operation efficiency of sample data classification can be improved.
【技术实现步骤摘要】
【国外来华专利技术】基于SVM的样本数据更新方法、分类系统和存储装置
本专利技术主要涉及计算机
,特别是涉及一种基于SVM的样本数据更新方法、分类系统和存储装置。
技术介绍
SVM(SupportVectorMachine)是指支持向量机,通常用来进行模式识别、分类以及回归分析。运用SVM算法对样本做分类时,若每个样本数据有n个特征,则可认为样本处于n维特征空间,从而利用n维超平面(hyperplane)将样本划分为两类。其中,n维超平面距离两类样本中最近的数据是等距的。当向一类样本中新增数据或者将一类样本中已有的部分数据删除,即当样本数据变更时,根据SVM算法,通常需要根据更新后的所有数据重新计算超平面。SVM通常用于图像识别和机器人深度学习等领域。本专利技术的专利技术人在对现有技术的研究过程中发现,对于现有的SVM样本数据更新方法,每次样本更新时都需要基于更新后的所有数据重新计算超平面,导致计算效率低下,难以满足图像识别或者机器人深度学习对计算速度的要求。
技术实现思路
本专利技术的提供一种基于SVM的样本数据更新方法、系统和存储装置,用于解决现有技术中SVM样本数据分类计算效率低下的问题。为解决上述技术问题,本专利技术采用的一技术方案是提供一种基于SVM的样本数据更新方法,该方法包括:获取样本数据以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;分别确定每一所述分类集合中的最大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据;根据待增加或待删除的数据点与所述最 ...
【技术保护点】
1.一种基于SVM的样本数据更新方法,其特征在于,包括:获取样本数据,以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;分别确定每一所述分类集合中的最大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据;根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新。
【技术特征摘要】
【国外来华专利技术】1.一种基于SVM的样本数据更新方法,其特征在于,包括:获取样本数据,以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;分别确定每一所述分类集合中的最大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据;根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新。2.如权利要求1所述的样本数据更新方法,其特征在于,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:判断所述待增加的数据点是否落在所述第一凸包空间内部;若未落在所述第一凸包空间内部,则更新所述最大凸包样本;若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新。3.如权利要求2所述的样本数据更新方法,其特征在于,所述更新所述最大凸包样本的步骤包括:将所述待增加的数据点添加至所述最大凸包样本。4.如权利要求1所述的样本数据更新方法,其特征在于,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:判断所述待删除的数据点是否落在所述第一凸包空间内部;若未落在所述第一凸包空间内部,则更新所述最大凸包样本;若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新。5.如权利要求4所述的样本数据更新方法,其特征在于,所述更新所述最大凸包样本的步骤包括:从所述最大凸包样本中删除所述待删除的数据点,以得到待定样本,所述待定样本在所述特征空间定义待定空间;判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内;若未全部落入所述待定空间,则将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤;若全部落入所述待定空间内,则所述最大凸包样本更新为所述待定样本。6.如权利要求5所述的样本数据更新方法,其特征在于,所述分别确定每一所述分类集合中的最大凸包样本的步骤进一步包括:分别确定每一所述分类集合中的次大凸包样本,所述次大凸包样本在所述特征空间内定义第二凸包空间,所述第二凸包空间能够容纳所述分类集合中除所述最大凸包样本和所述次大凸包样本以外的其他样本数据;所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,以及将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本中的步骤中,所述除所述最大凸包样本以外的其他样本数据是指所述次大凸包样本。7.如权利要求6所述的样本数据更新方法,其特征在于,在所述更新所述最大凸包样本的步骤中:所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤包括:将所述次大凸包样本中最接近所述待删除的数据点的样本数据作为待定数据点;以及判断所述待定数据点是否落入所述待定空间内;若未落入所述待定空间内,则所述将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,包括:将所述待定数据点添加到所述待定样本;将所述待定数据点更新为所述次大凸包样本中所述待定数据点的邻近数据点,并将原所述待定数据点从所述次大凸包样本中删除;返回判断所述待定数据点是否落入所述待定空间内的步骤。8.如权利要求1-7任一项所述的样本数据更新方法,其特征在于,所述根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新的步骤包括:若对所述最大凸包样本进行了更新,则检测更新后的所述最大凸包样本中离所述分类超平面最接近的样本数据是否发生变化,若发生变化,则重新计算并更新所述分类超平面,否则,不对所述分类超平面进行更新;若未对所述最大凸包样本进行更新,则不对所述分类超平面进行更新。9.一种基于SVM的样本数据分类系统,其特征在于,包括电耦合的处理器和存储器,其中所述存储器用于存储程序指令,所述处理器可加载所述程序指令并执行:获取样本数据以及在...
【专利技术属性】
技术研发人员:阳光,吴峰,
申请(专利权)人:深圳配天智能技术研究院有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。