分类器训练方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:20119118 阅读:17 留言:0更新日期:2019-01-16 12:18
本发明专利技术公开了一种分类器训练方法、装置、设备和计算机存储介质,该方法包括:确定分类器对应的用于计算梯度方向的目标函数,目标函数的参数为分类器的待确定的特征向量系数;从预设的训练样本集中抽取训练子集,并获取已代入目标函数中计算梯度方向的训练样本集中的其他子集;将训练子集和其他子集代入目标函数计算梯度方向;根据计算结果确定特征向量系数的值;根据特征向量系数的值,确定分类器。根据本发明专利技术,在抽取训练子集进行训练时,同时考虑当前抽取的样本子集和前一样本子集,根据向量的叠加原理,可以保持梯度是按照梯度下降的方向,一定程度上优化了对边缘样本的容错率,同时兼备了高效性。

Classifier training methods, devices, equipment and computer-readable storage media

The invention discloses a classifier training method, device, equipment and computer storage medium. The method includes: determining the objective function corresponding to the classifier for calculating gradient direction, and the parameters of the objective function are the characteristic vector coefficients to be determined by the classifier; extracting the training subset from the preset training sample set, and obtaining the training subset that has been substituted for the objective function to calculate gradient direction. The other subsets of the training sample set; the training subset and other subsets are substituted into the objective function to calculate the gradient direction; the eigenvector coefficients are determined according to the calculation results; and the classifier is determined according to the eigenvector coefficients. According to the present invention, when extracting training subset for training, considering the current sample subset and the same subset as before, according to the superposition principle of vectors, the gradient can be maintained in the direction of gradient descent, and the fault tolerance rate of edge samples can be optimized to a certain extent, with high efficiency.

【技术实现步骤摘要】
分类器训练方法、装置、设备和计算机可读存储介质
本专利技术涉及计算机
,尤其涉及一种分类器训练方法、装置、设备和计算机可读存储介质。
技术介绍
随着4G(第四代移动通信技术)应用的推广,无线网络的服务主体逐渐向数据业务转移,越来越多的用户使用无线终端享受数据服务,例如观看视频,浏览网页、聊天等。每种数据业务的特征不同,对于无线网络的资源占用情况也有很大差异:使用聊天工具的用户,在线时长往往大于下载文件的用户,但是其流量可能只有下载用户的百分之一,同时不同的业务对于无线环境的要求也不一致。为了改善用户使用感受,我们需要了解无线网元上的现有资源是否能够满足用户业务的需要,也就是依赖于用户业务分类和感知评估的方法。解决这个问题需要根据业务特征(业务量大小、业务时长,业务时延,丢包率等)对业务进行有效的识别和分类,因此,业务分类成为了一个重耍的研究方向。目前,用于数据业务分类的支持向量机(SVM)分类算法一般使用的是批量处理算法,由于批量处理算法需要将整个数据集加载到内存之中,使得它不适合大量数据的情况,无法应用于实时性较高的场合。而分类器的构建需要耗费大量的时间,导致后面到达的信息可能会由于处理不及时使得重要信息丢失,无法高效的对后来的数据进行准确的预测及处理操作。现在也有利用改进的随机梯度下降算法(SGD)算法来求解SVM,但由于SGD是选取的随机数据来处理,由于每次只是针对一个样本,这样不可避免造成梯度不是每次都向着下降的方向的,收敛曲线很不平滑,且对于噪声样本的影响较大。
技术实现思路
本专利技术的目的在于提供一种分类器训练方法、装置、设备和计算机可读存储介质,针对海量复杂数据分类耗费大量时间以及准确率不够高的问题。本专利技术解决上述技术问题所采用的技术方案如下:提供的一种分类器训练方法,所述分类器训练方法包括:确定分类器对应的用于计算梯度方向的目标函数,所述目标函数的参数为所述分类器的待确定的特征向量系数;从预设的训练样本集中抽取训练子集,并获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集;将所述训练子集和所述其他子集代入所述目标函数计算梯度方向;根据计算结果确定所述特征向量系数的值;根据所述特征向量系数的值,确定所述分类器。可选地,前述的分类器训练方法,所述将所述训练子集和所述其他子集代入所述目标函数计算梯度方向的步骤,还包括:在不存在已代入所述目标函数中进行的所述其他子集时,将所述训练子集代入所述目标函数计算梯度方向。可选地,前述的分类器训练方法,所述获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集的步骤包括:获取在所述训练子集前抽取并代入所述目标函数中进行计算的前一子集。可选地,前述的分类器训练方法,所述目标函数中包含所述分类器的损失函数,所述将所述训练子集和所述其他子集代入所述目标函数计算梯度方向的步骤包括:计算所述分类器的损失函数,并根据所述损失函数计算出所述目标函数的梯度方向。可选地,前述的分类器训练方法,所述训练样本集为通信业务数据样本集,所述训练器用于对通信业务进行分类。提供的一种分类器训练装置,所述分类器训练装置包括:目标函数确定模块,确定分类器对应的用于计算梯度方向的目标函数,所述目标函数的参数为所述分类器的待确定的特征向量系数;训练子集获取模块,从预设的训练样本集中抽取训练子集,并获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集;梯度方向计算模块,将所述训练子集和所述其他子集代入所述目标函数计算梯度方向;特征向量确定模块,根据计算结果确定所述特征向量系数的值;分类器确定模块,根据所述特征向量系数的值,确定所述分类器。可选地,前述的分类器训装置,所述梯度方向计算模块在不存在已代入所述目标函数中进行的所述其他子集时,将所述训练子集代入所述目标函数计算梯度方向。可选地,前述的分类器训装置,所述训练子集获取模块获取在所述训练子集前抽取并代入所述目标函数中进行计算的前一子集。可选地,前述的分类器训装置,所述目标函数中包含所述分类器的损失函数,所述梯度方向计算模块计算所述分类器的损失函数,并根据所述损失函数计算出所述目标函数的梯度方向。可选地,前述的分类器训装置,所述训练样本集为通信业务数据样本集,所述训练器用于对通信业务进行分类。提供的一种分类器训练设备,所述分类器训练设备包括处理器、存储器及通信总线;所述通信总线用于实现处理器和存储器之间的连接通信;所述处理器用于执行存储器中存储的分类器训练程序,以实现前述的分类器训练方法的步骤。提供的一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述的分类器训练方法的步骤。根据以上技术方案,可知本专利技术的分类器训练方法、装置、设备和计算机可读存储介质至少具有以下优点:根据本专利技术的技术方案,在抽取训练子集进行训练时,同时考虑当前抽取的样本子集和前一样本子集,根据向量的叠加原理,可以保持梯度是按照梯度下降的方向,一定程度上优化了对边缘样本的容错率,最终收敛得到的结果更加接近最优值,同时兼备了高效性,利用少量的数据也能得到比较准确的结果,增加了收敛的精确性,同时对于目标函数的收敛比SGD精确,抗噪声性也会较之更好。附图说明图1为本专利技术实施例的一种分类器训练方法的流程图;图2为本专利技术实施例的一种分类器训练方法的流程图;图3为本专利技术实施例的一种分类器训练方法的流程图;图4为本专利技术实施例的一种分类器训练方法的流程图;图5为本专利技术实施例的一种分类器训练方法的框架示意图;图6为本专利技术实施例的一种分类器训练装置的框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。实施例一如图1所示,本专利技术的一个实施例中提供一种分类器训练方法,本实施例的分类器训练方法包括:步骤S110,确定分类器对应的用于计算梯度方向的目标函数,目标函数的参数为分类器的待确定的特征向量系数。在本实施例中,对分类器的应用不进行限制,可以应用于对任何类型数据的分类。除了可以应用于批量数据处理领域,例如生物识别、信号识别和检测、图像识别等多个领域,还可以应用于海量实时数据流的分类、回归、聚类,例如实时证券交易和电子商务中的经济数据分类分析、物联网系统中移动医疗的实时医疗诊断,智慧交通的实时交通流量预测等实时数据流的分析,为未来海量实时数据的应用奠定了理论基础。在本实施例中,对分类器的数量不进行限制,可以根据需要确定分类器的个数,建立一个比较大的数据样本集(一般需要正负样本都有)。在本实施例中,对分类器所采用的目标函数不进行限制,具体可以根据实验效果选择目标函数。步骤S120,从预设的训练样本集中抽取训练子集,并获取已代入目标函数中计算梯度方向的训练样本集中的其他子集。在本实施例中,并非仅考虑当前抽取的训练子集,同时兼顾了在先的样本子集(在先样本子集的数量可根据需要灵活设置),根据向量的叠加原理,可以保持梯度是按照梯度下降的方向,一定程度上优化了对边缘样本的容错率,本文档来自技高网...

【技术保护点】
1.一种分类器训练方法,其特征在于,所述分类器训练方法包括:确定分类器对应的用于计算梯度方向的目标函数,所述目标函数的参数为所述分类器的待确定的特征向量系数;从预设的训练样本集中抽取训练子集,并获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集;将所述训练子集和所述其他子集代入所述目标函数计算梯度方向;根据计算结果确定所述特征向量系数的值;根据所述特征向量系数的值,确定所述分类器。

【技术特征摘要】
1.一种分类器训练方法,其特征在于,所述分类器训练方法包括:确定分类器对应的用于计算梯度方向的目标函数,所述目标函数的参数为所述分类器的待确定的特征向量系数;从预设的训练样本集中抽取训练子集,并获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集;将所述训练子集和所述其他子集代入所述目标函数计算梯度方向;根据计算结果确定所述特征向量系数的值;根据所述特征向量系数的值,确定所述分类器。2.根据权利要求1所述的分类器训练方法,其特征在于,所述将所述训练子集和所述其他子集代入所述目标函数计算梯度方向的步骤,还包括:在不存在已代入所述目标函数中进行的所述其他子集时,将所述训练子集代入所述目标函数计算梯度方向。3.根据权利要求1所述的分类器训练方法,其特征在于,所述获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集的步骤包括:获取在所述训练子集前抽取并代入所述目标函数中进行计算的前一子集。4.根据权利要求1所述的分类器训练方法,其特征在于,所述目标函数中包含所述分类器的损失函数,所述将所述训练子集和所述其他子集代入所述目标函数计算梯度方向的步骤包括:计算所述分类器的损失函数,并根据所述损失函数计算出所述目标函数的梯度方向。5.根据权利要求1至4中任一项所述的分类器训练方法,其特征在于,所述训练样本集为通信业务数据样本集,所述训练器用于对通信业务进行分类。6.一种分类器...

【专利技术属性】
技术研发人员:徐以华
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1