【技术实现步骤摘要】
一种分类模型训练的方法及装置
本申请涉及机器学习
,尤其涉及一种分类模型训练的方法及装置。
技术介绍
监督学习(Supervisedlearning),是机器学习中的方法,可以由训练资料中学到或建立一个模式(learningmodel),并依此模式推测新的实例。其中,监督学习的方法可以分为生成方法(也称生成学习算法,generativelearningalgorithm)和判别方法(也称判别学习方法,discriminativelearningalgorithm),所学到的模型分别称为生成模型(GenerativeModel)和判别模型(DiscriminativeModel)。在生成方法中,由数据学习联合概率密度分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型:P(Y|X)=P(X,Y)/P(X)。基本思想是首先建立样本的联合概率密度模型P(X,Y),然后得到后验概率P(Y|X),再利用后验概率进行分类。在判别方法中,由数据直接学习决策函数Y=f(X)或者条件概率分布P(Y ...
【技术保护点】
1.一种分类模型训练的方法,其特征在于,所述方法包括:/n计算各个样本特征在N个不同分类类别中的先验概率,其中,N大于1;/n针对每一样本特征,依据该样本特征在N个不同分类类别中的先验概率确定该样本特征的分类系数;/n将各个样本特征的分类系数组成分类系数矩阵,依据所述分类系数矩阵与样本特征矩阵确定待训练样本特征,所述样本特征矩阵由所述样本特征组成;/n采用梯度提升决策树GBDT算法对所述待训练样本特征进行训练得到分类模型。/n
【技术特征摘要】
1.一种分类模型训练的方法,其特征在于,所述方法包括:
计算各个样本特征在N个不同分类类别中的先验概率,其中,N大于1;
针对每一样本特征,依据该样本特征在N个不同分类类别中的先验概率确定该样本特征的分类系数;
将各个样本特征的分类系数组成分类系数矩阵,依据所述分类系数矩阵与样本特征矩阵确定待训练样本特征,所述样本特征矩阵由所述样本特征组成;
采用梯度提升决策树GBDT算法对所述待训练样本特征进行训练得到分类模型。
2.根据权利要求1所述的方法,其特征在于,所述N为2;
所述依据该样本特征在N个不同分类类别中的先验概率确定该样本特征的分类系数,包括:
计算该样本特征在两个分类类别中的先验概率的比值;
将所述比值的对数作为该样本特征的分类系数。
3.根据权利要求1所述的方法,其特征在于,所述N大于2;
所述依据该样本特征在N个不同分类类别中的先验概率确定该样本特征的分类系数,包括:
从该样本特征在N个不同分类类别中的先验概率中,选取取值最大的先验概率;
将选取的先验概率作为该样本特征的分类系数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述计算各个样本特征在N个不同分类类别中的先验概率,包括:
对各个样本特征进行离散化处理获得多个特征簇,其中,每个特征簇包括多个样本特征;
针对每一特征簇,采用朴素贝叶斯算法对该特征簇中包含的各个样本特征的特征值进行累计得到特征总值,基于所述特征总值计算该特征簇分别在N个分类类别中的先验概率,将该特征簇在N个分类类别中的先验概率确定为该特征簇中各个样本特征在N个分类类别中的先验概率。
5.根据权利要求1所述的方法,其特征在于,所述依据所述分类系数矩阵与样本特征矩阵确定待训练样本特征,包括:
将所述分类系数矩阵与样本特征矩阵进行点乘运算得到所述待训练样本...
【专利技术属性】
技术研发人员:李国琪,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。