【技术实现步骤摘要】
一种维修厂分类方法及装置
本申请涉及数据挖掘
,尤其涉及一种维修厂分类方法及装置。
技术介绍
维修厂直接向消费者提供各类服务,其专业水平、服务质量影响着消费者的体验。针对各个维修厂的大量数据,区分出不同专业水平、服务质量的维修厂,具有强大的现实意义。目前,基于线性回归监督学习模型和专家系统的分类方法,分类规则不统一,导致结果偏差较大,并且分类结果与数据特征线性相关性弱。监督学习算法,对获取的大量客观的已标记维修厂数据,训练机器学习模型,并确立分类方法;实际中,获取大量客观的已标记数据很困难,需要大量人力、物力、财力的投入。另一种基于K均值聚类无监督学习算法的分类方法,对输入的数据要求高,而且分类结果的实际意义具有不确定性。另外,无监督学习算法直接对未标记的原始维修厂数据进行建模分类,其结果可能不具客观性,实用性值得怀疑。如何通过少量的标记维修厂数据预测并确定大量未标记维修厂数据,再确定维修厂的类别,使得分类结果与数据特征吻合,降低数据处理难度,得出更客观、合理的分类结果,是本申请需解决的问题。
技术实现思路
本申请实施例提供的维修厂分类方法,通过少量的标记维修厂 ...
【技术保护点】
1.一种维修厂分类方法,其特征在于,包括:根据n个维修厂的特征信息,分别构建所述n个维修厂对应的n个特征信息集合;其中,n为大于0的整数;从所述n个特征信息集合中确定L个目标特征信息集合对应的C类标签;其中,L为大于0且小于n的整数,C为小于或者等于L的正整数,且每个目标特征信息集合对应一个标签;根据所述L个目标特征信息集合和所述L个目标特征信息集合对应的C类标签,通过标签传播算法LPA确定(n‑L)个未标记特征信息集合中任意一个特征信息集合在所述C类标签中对应的标签;所述(n‑L)个未标记特征信息集合为所述n个特征信息集合中除所述L个目标特征信息集合外的特征信息集合;其中 ...
【技术特征摘要】
1.一种维修厂分类方法,其特征在于,包括:根据n个维修厂的特征信息,分别构建所述n个维修厂对应的n个特征信息集合;其中,n为大于0的整数;从所述n个特征信息集合中确定L个目标特征信息集合对应的C类标签;其中,L为大于0且小于n的整数,C为小于或者等于L的正整数,且每个目标特征信息集合对应一个标签;根据所述L个目标特征信息集合和所述L个目标特征信息集合对应的C类标签,通过标签传播算法LPA确定(n-L)个未标记特征信息集合中任意一个特征信息集合在所述C类标签中对应的标签;所述(n-L)个未标记特征信息集合为所述n个特征信息集合中除所述L个目标特征信息集合外的特征信息集合;其中,(n-L)为大于0且小于n的整数。2.根据权利要求1所述的方法,其特征在于,所述n个特征信息集合,包括:从所述n个维修厂的特征信息分别构建的画像中确定的特征信息集合。3.根据权利要求1所述的方法,其特征在于,所述从所述n个特征信息集合中确定L个目标特征信息集合对应的C类标签,包括:按照预设的抽样规则,确定所述L个目标特征信息集合;所述L个目标特征信息集合的标签为C类标签;按照预设的标记方法,标记所述L个目标特征信息集合的标签。4.根据权利要求1-3任意一项所述的方法,其特征在于,所述根据所述L个目标特征信息集合和所述L个目标特征信息集合对应的C类标签,通过标签传播算法LPA确定(n-L)个未标记特征信息集合中任意一个特征信息集合在所述C类标签中对应的标签,包括:根据所述n个特征信息集合,构造无向图,计算无向图中边的权重其中,所述无向图中n个节点分别对应所述n个维修厂,i为大于0且小于或者等于n的任一整数,j为大于0且小于或者等于n的任一整数,i≠j;边的权重Wij为节点i与节点j之间边的权重,表示维修厂i与维修厂j的标签相似性;α为预设的参数,xi、xj分别为节点i、节点j对应的特征信息集合,||xi-xj||2为节点i与节点j之间的欧式距离平方;计算转移概率Pij,构造转移概率矩阵P;其中,Pij为节点i到节点j的概率,Wik为节点i与节点k之间边的权重,k为大于0且小于或者等于n的整数,i≠k;为节点i与所述n个节点中除所述节点i外的n-1个节点之间的边的权重总和;根据所述C类标签和所述L个节点,构造L×C的标签矩阵YL;根据所述的C类标签和所述(n-L)个节点,构造(n-L)×C的标签矩阵Yn-L;合并所述标签矩阵YL和所述标签矩阵Yn-L,得到n×C的矩阵F=[YL,Yn-L];其中,所述标签矩阵YL为由L×C个数ylc排成L行C列的数表,第l行表示第l个节点,l为小于或者等于L的任一正整数,第c行表示第c类标签,c为小于或者等于C的任一正整数;所述标签矩阵Yn-L为由(n-L)×C个数yhq排成(n-L)行C列的数表,第h行表示第h个节点,h为小于或者等于(n-L)的任一正整数,第q行表示第q类标签,q为小于或者等于C的任一正整数,所述数Yhq的初始值为任意值;所述矩阵F为由n×C个数yfg排成n行C列的数表,第f行表示第f个节点,f为小于或者等于n的任一正整数,第g行表示第g类标签,g为小于或者等于C的任一正整数;根据公...
【专利技术属性】
技术研发人员:刘新,张小琼,
申请(专利权)人:深圳市元征科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。