The invention discloses a classifier training method, device, equipment and computer storage medium. The method includes: determining the objective function corresponding to the classifier for calculating gradient direction, and the parameters of the objective function are the characteristic vector coefficients to be determined by the classifier; extracting the training subset from the preset training sample set, and obtaining the training subset that has been substituted for the objective function to calculate gradient direction. The other subsets of the training sample set; the training subset and other subsets are substituted into the objective function to calculate the gradient direction; the eigenvector coefficients are determined according to the calculation results; and the classifier is determined according to the eigenvector coefficients. According to the present invention, when extracting training subset for training, considering the current sample subset and the same subset as before, according to the superposition principle of vectors, the gradient can be maintained in the direction of gradient descent, and the fault tolerance rate of edge samples can be optimized to a certain extent, with high efficiency.
【技术实现步骤摘要】
分类器训练方法、装置、设备和计算机可读存储介质
本专利技术涉及计算机
,尤其涉及一种分类器训练方法、装置、设备和计算机可读存储介质。
技术介绍
随着4G(第四代移动通信技术)应用的推广,无线网络的服务主体逐渐向数据业务转移,越来越多的用户使用无线终端享受数据服务,例如观看视频,浏览网页、聊天等。每种数据业务的特征不同,对于无线网络的资源占用情况也有很大差异:使用聊天工具的用户,在线时长往往大于下载文件的用户,但是其流量可能只有下载用户的百分之一,同时不同的业务对于无线环境的要求也不一致。为了改善用户使用感受,我们需要了解无线网元上的现有资源是否能够满足用户业务的需要,也就是依赖于用户业务分类和感知评估的方法。解决这个问题需要根据业务特征(业务量大小、业务时长,业务时延,丢包率等)对业务进行有效的识别和分类,因此,业务分类成为了一个重耍的研究方向。目前,用于数据业务分类的支持向量机(SVM)分类算法一般使用的是批量处理算法,由于批量处理算法需要将整个数据集加载到内存之中,使得它不适合大量数据的情况,无法应用于实时性较高的场合。而分类器的构建需要耗费大量的时间,导致后面到达的信息可能会由于处理不及时使得重要信息丢失,无法高效的对后来的数据进行准确的预测及处理操作。现在也有利用改进的随机梯度下降算法(SGD)算法来求解SVM,但由于SGD是选取的随机数据来处理,由于每次只是针对一个样本,这样不可避免造成梯度不是每次都向着下降的方向的,收敛曲线很不平滑,且对于噪声样本的影响较大。
技术实现思路
本专利技术的目的在于提供一种分类器训练方法、装置、设备和计算机可读存 ...
【技术保护点】
1.一种分类器训练方法,其特征在于,所述分类器训练方法包括:确定分类器对应的用于计算梯度方向的目标函数,所述目标函数的参数为所述分类器的待确定的特征向量系数;从预设的训练样本集中抽取训练子集,并获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集;将所述训练子集和所述其他子集代入所述目标函数计算梯度方向;根据计算结果确定所述特征向量系数的值;根据所述特征向量系数的值,确定所述分类器。
【技术特征摘要】
1.一种分类器训练方法,其特征在于,所述分类器训练方法包括:确定分类器对应的用于计算梯度方向的目标函数,所述目标函数的参数为所述分类器的待确定的特征向量系数;从预设的训练样本集中抽取训练子集,并获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集;将所述训练子集和所述其他子集代入所述目标函数计算梯度方向;根据计算结果确定所述特征向量系数的值;根据所述特征向量系数的值,确定所述分类器。2.根据权利要求1所述的分类器训练方法,其特征在于,所述将所述训练子集和所述其他子集代入所述目标函数计算梯度方向的步骤,还包括:在不存在已代入所述目标函数中进行的所述其他子集时,将所述训练子集代入所述目标函数计算梯度方向。3.根据权利要求1所述的分类器训练方法,其特征在于,所述获取已代入所述目标函数中计算梯度方向的所述训练样本集中的其他子集的步骤包括:获取在所述训练子集前抽取并代入所述目标函数中进行计算的前一子集。4.根据权利要求1所述的分类器训练方法,其特征在于,所述目标函数中包含所述分类器的损失函数,所述将所述训练子集和所述其他子集代入所述目标函数计算梯度方向的步骤包括:计算所述分类器的损失函数,并根据所述损失函数计算出所述目标函数的梯度方向。5.根据权利要求1至4中任一项所述的分类器训练方法,其特征在于,所述训练样本集为通信业务数据样本集,所述训练器用于对通信业务进行分类。6.一种分类器...
【专利技术属性】
技术研发人员:徐以华,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。