基于SVM的样本数据更新方法、分类系统和存储装置制造方法及图纸

技术编号:20499778 阅读:27 留言:0更新日期:2019-03-03 03:26
一种基于SVM的样本数据更新方法,该方法包括:获取样本数据以及在特征空间内将样本数据划分成至少两个分类集合的分类超平面(S101);分别确定每一分类集合中的最大凸包样本,其中最大凸包样本用于在特征空间内定义第一凸包空间,第一凸包空间能够容纳所述分类集合中除最大凸包样本以外的其他样本数据(S102);根据待增加或待删除的数据点与最大凸包样本的位置关系,对最大凸包样本进行选择性更新(S103);以及根据最大凸包样本的更新情况,对分类超平面进行选择性更新(S104)。通过根据待增加或待删除的数据点与最大凸包样本的位置关系对最大凸包样本进行选择性更新和对分类超平面进行选择性更新,可以提高样本数据分类的运算效率。

Sample Data Updating Method, Classification System and Storage Device Based on SVM

A method of sample data updating based on SVM is presented. The method includes: obtaining sample data and dividing sample data into at least two classification sets in feature space (S101); determining the maximum convex hull samples in each classification set separately. The largest convex hull samples are used to define the first convex hull space in feature space, and the first convex hull space can accommodate the described. Sample data (S102) other than the maximum convex hull sample in the classification set; selective updating of the maximum convex hull sample (S103) based on the location relationship between the data points to be added or deleted and the maximum convex hull sample; and selective updating of the classification hyperplane (S104) based on the updating of the maximum convex hull sample. By selectively updating the maximum convex hull samples and selectively updating the classification hyperplane according to the position relationship between the data points to be added or deleted and the maximum convex hull samples, the operation efficiency of sample data classification can be improved.

【技术实现步骤摘要】
【国外来华专利技术】基于SVM的样本数据更新方法、分类系统和存储装置
本专利技术主要涉及计算机
,特别是涉及一种基于SVM的样本数据更新方法、分类系统和存储装置。
技术介绍
SVM(SupportVectorMachine)是指支持向量机,通常用来进行模式识别、分类以及回归分析。运用SVM算法对样本做分类时,若每个样本数据有n个特征,则可认为样本处于n维特征空间,从而利用n维超平面(hyperplane)将样本划分为两类。其中,n维超平面距离两类样本中最近的数据是等距的。当向一类样本中新增数据或者将一类样本中已有的部分数据删除,即当样本数据变更时,根据SVM算法,通常需要根据更新后的所有数据重新计算超平面。SVM通常用于图像识别和机器人深度学习等领域。本专利技术的专利技术人在对现有技术的研究过程中发现,对于现有的SVM样本数据更新方法,每次样本更新时都需要基于更新后的所有数据重新计算超平面,导致计算效率低下,难以满足图像识别或者机器人深度学习对计算速度的要求。
技术实现思路
本专利技术的提供一种基于SVM的样本数据更新方法、系统和存储装置,用于解决现有技术中SVM样本数据分类计算效率低下的问题。为解决上述技术问题,本专利技术采用的一技术方案是提供一种基于SVM的样本数据更新方法,该方法包括:获取样本数据以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;分别确定每一所述分类集合中的最大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据;根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新。为解决上述技术问题,本专利技术采用的另一技术方案是提供一种基于SVM的样本数据分类系统,该系统包括电耦合的处理器和存储器,其中所述存储器用于存储程序指令,所述处理器可加载所述程序指令并执行上述样本数据更新方法。为解决上述技术问题,本专利技术采用的又一技术方案是提供一种具有存储功能的装置,用于存储程序指令,所述程序指令可被执行以实现上述样本数据更新方法。本专利技术实施例的有益效果是:通过根据待增加或待删除的数据点与最大凸包样本的位置关系对最大凸包样本进行选择性更新,并根据最大凸包样本的更新情况对分类超平面进行选择性更新,可以提高样本数据分类的运算效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:图1是本专利技术基于SVM的样本数据更新方法一实施例的流程示意图。图2是本专利技术基于SVM的样本数据更新方法另一实施例的流程示意图。图3是本专利技术最大凸包更新方法一实施例的流程示意图。图4示出了在二维特征空间上利用超平面对样本数据进行分类的示意图。图5示出了对如图4所述的样本数据新增数据点的示意图。图6示出了图5中的样本数据及分类超平面经过更新后的示意图。图7示出了对如图4所述的样本数据删除数据点的示意图。图8示出了图7中的样本数据及分类超平面经过更新后的示意图。图9示出了对如图4所述的样本数据删除数据点的另一例子的示意图。图10示出了图9中的样本数据及分类超平面经过更新后的示意图。图11示出了本专利技术基于SVM的样本数据分类系统一实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,图1是本专利技术基于SVM的样本数据更新方法一实施例的流程示意图。如图1所示,本专利技术基于SVM的样本数据更新方法可包括以下步骤:S101:获取样本数据以及在特征空间内将该样本数据划分成至少两个分类集合的分类超平面。样本数据即待分类的数据的总和,在不同的应用场景中,样本数据对应不同类型的数据,例如,在图像识别技术中,摄像头摄取的图像数据化得到的样本数据,或者在自动驾驶技术中,外部车辆或者控制系统发来的数据信息等。在后续的处理中,需要将获取的样本数据分类(例如,前景和后景,人和车辆等),基于SVM算法,通常可以利用特征空间内的分类超平面对这些获取的样本数据进行处理。特征空间和分类超平面均为数学上的概念,而不是实际存在的空间和平面。例如,一个数据点如果可以用n个特征描述,则该数据点可以作为一个n维向量x=(x1,x2,……,xn),n维特征空间可以被定义以容纳这些数据点,而在数据可以分类的情况下,可以在n维特征空间中找到一个超平面(例如,在二维特征空间中,可以是一条直线、曲线、圆形等,在三维特征空间中,可以是平面、曲面等),使所有数据点在超平面两侧分为两类,且两类数据中离超平面最近的数据点到超平面的距离相同。可以理解,若可以同时定义多个分类超平面,则可以将样本数据划分为超过两个的分类集合。为方便解释说明,下文均以二维特征空间中存在一个超平面的情况为例进行说明。在步骤S101中,获取样本数据,以及在对应维度的特征空间内将该样本数据划分为至少两个分类集合的分类超平面。例如,如图4所示,首先获取图4中所有的数据点(三角形或圆形),并获取将这些数据点划分为A类和B类集合的分类超平面HP。在一些实施例中,这些数据点以及分类超平面HP可以是已计算、待更新的,在另一些实施例中,这些数据点也可以是在获取数据的最初阶段获取的,而分类超平面HP可以根据现有的SVM算法计算得到。S102:分别确定每一类集合中的最大凸包样本,其中最大凸包样本用于在特征空间内定义第一凸包空间,第一凸包空间能够容纳分类集合中除最大凸包样本以外的其他样本数据。仍然以图4为例,在步骤S102中,对A类集合和B类集合分别确定最大凸包样本CA和CB,CA和CB分别在特征空间内定义第一凸包空间,可以从图中直观的看出,最大凸包样本即该类集合中“最外侧”的数据点的集合,将这些数据点相连后其内部的空间即为第一凸包空间。第一凸包空间能够容纳分类集合中除最大凸包样本(最大凸包的边界)以外的其他数据点。S103:根据待增加或待删除的数据点与最大凸包样本的位置关系,对最大凸包样本进行选择性更新。在步骤S103中,当需要向样本中新增数据点或者删除数据点时,判断待增加或待删除的数据点与最大凸包样本的位置关系。例如,若对A类集合(根据超平面HP判断)新增或删除数据点,则比较待增加或待删除的数据点与最大凸包样本CA进行比较。根据比较的结果,对最大凸包样本CA进行选择性更新。例如,若待增加或待删除的数据点在CA的内部,则不会对最大凸包样本CA产生影响,无需对最大凸包样本CA进行更新;反之,若待增加的数据点在CA的外侧,或待删除的数据点属于最大凸包样本CA,则需要对最大凸包样本CA进行更新。S104:根据最大凸包样本的更新情况,对分类超平面进行选择性更新。在步骤S104中,若步骤S103中未对最大凸包样本进行更新,则同样无需更新分类超本文档来自技高网...

【技术保护点】
1.一种基于SVM的样本数据更新方法,其特征在于,包括:获取样本数据,以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;分别确定每一所述分类集合中的最大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据;根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新。

【技术特征摘要】
【国外来华专利技术】1.一种基于SVM的样本数据更新方法,其特征在于,包括:获取样本数据,以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;分别确定每一所述分类集合中的最大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据;根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新。2.如权利要求1所述的样本数据更新方法,其特征在于,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:判断所述待增加的数据点是否落在所述第一凸包空间内部;若未落在所述第一凸包空间内部,则更新所述最大凸包样本;若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新。3.如权利要求2所述的样本数据更新方法,其特征在于,所述更新所述最大凸包样本的步骤包括:将所述待增加的数据点添加至所述最大凸包样本。4.如权利要求1所述的样本数据更新方法,其特征在于,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:判断所述待删除的数据点是否落在所述第一凸包空间内部;若未落在所述第一凸包空间内部,则更新所述最大凸包样本;若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新。5.如权利要求4所述的样本数据更新方法,其特征在于,所述更新所述最大凸包样本的步骤包括:从所述最大凸包样本中删除所述待删除的数据点,以得到待定样本,所述待定样本在所述特征空间定义待定空间;判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内;若未全部落入所述待定空间,则将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤;若全部落入所述待定空间内,则所述最大凸包样本更新为所述待定样本。6.如权利要求5所述的样本数据更新方法,其特征在于,所述分别确定每一所述分类集合中的最大凸包样本的步骤进一步包括:分别确定每一所述分类集合中的次大凸包样本,所述次大凸包样本在所述特征空间内定义第二凸包空间,所述第二凸包空间能够容纳所述分类集合中除所述最大凸包样本和所述次大凸包样本以外的其他样本数据;所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,以及将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本中的步骤中,所述除所述最大凸包样本以外的其他样本数据是指所述次大凸包样本。7.如权利要求6所述的样本数据更新方法,其特征在于,在所述更新所述最大凸包样本的步骤中:所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤包括:将所述次大凸包样本中最接近所述待删除的数据点的样本数据作为待定数据点;以及判断所述待定数据点是否落入所述待定空间内;若未落入所述待定空间内,则所述将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,包括:将所述待定数据点添加到所述待定样本;将所述待定数据点更新为所述次大凸包样本中所述待定数据点的邻近数据点,并将原所述待定数据点从所述次大凸包样本中删除;返回判断所述待定数据点是否落入所述待定空间内的步骤。8.如权利要求1-7任一项所述的样本数据更新方法,其特征在于,所述根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新的步骤包括:若对所述最大凸包样本进行了更新,则检测更新后的所述最大凸包样本中离所述分类超平面最接近的样本数据是否发生变化,若发生变化,则重新计算并更新所述分类超平面,否则,不对所述分类超平面进行更新;若未对所述最大凸包样本进行更新,则不对所述分类超平面进行更新。9.一种基于SVM的样本数据分类系统,其特征在于,包括电耦合的处理器和存储器,其中所述存储器用于存储程序指令,所述处理器可加载所述程序指令并执行:获取样本数据以及在...

【专利技术属性】
技术研发人员:阳光吴峰
申请(专利权)人:深圳配天智能技术研究院有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1