【技术实现步骤摘要】
分类方法、装置、设备以及存储介质
[0001]本公开涉及计算机
,尤其涉及大数据、数据挖掘、机器学习等领域。
技术介绍
[0002]在对各种平台的使用者等进行标签化过程中,许多类型的标签,需要依赖人工收集标签的样本。因此,收集过程需要花费较长的时间,并且,所需的人力成本较多。
技术实现思路
[0003]本公开提供了一种分类方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种分类方法,包括:
[0005]根据出现在目标区域内的对象的位置信息,得到该对象的特征向量;
[0006]对该对象的特征向量进行聚类训练,得到该对象所归属的类簇。
[0007]根据本公开的另一方面,提供了一种分类装置,包括:
[0008]特征向量模块,用于根据出现在目标区域内的对象的位置信息,得到该对象的特征向量;
[0009]聚类训练模块,用于对该对象的特征向量进行聚类训练,得到该对象所归属的类簇。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:
[0011]至少一个处理器;以及
[0012]与该至少一个处理器通信连接的存储器;其中,
[0013]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例的方法。
[0014]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行本公开任 ...
【技术保护点】
【技术特征摘要】
1.一种分类方法,包括:根据出现在目标区域内的对象的位置信息,得到所述对象的特征向量;对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇。2.根据权利要求1所述的方法,其中,所述对象的位置信息包括所述对象的定位名称,根据出现在目标区域内的对象的位置信息,得到所述对象的特征向量,包括:根据所述对象的定位名称,得到所述对象的定位名称向量;根据第一时间范围内出现在所述目标区域内所述对象的定位名称向量,得到所述对象的特征向量。3.根据权利要求2所述的方法,其中,根据所述对象的定位名称,得到所述对象的定位名称向量,包括:将所述对象的定位名称的所有分词的词向量求和平均,得到所述对象的定位名称向量。4.根据权利要求2或3所述的方法,其中,所述第一时间范围包括多个时间段,根据第一时间范围内出现在所述目标区域内所述对象的定位名称向量,得到所述对象的特征向量,包括:将每个时间段内包括的所述对象的多个定位名称向量求和平均,得到每个时间段对应的所述对象的子向量;将所述多个时间段对应的所述对象的子向量进行拼接,得到所述对象的特征向量。5.根据权利要求2或3所述的方法,其中,所述第一时间范围包括多个时间段,根据第一时间范围内出现在所述目标区域内所述对象的定位名称向量,得到所述对象的特征向量,包括:将每个时间段内包括的所述对象的多个定位名称向量求和平均,得到每个时间段对应的所述对象的子向量;将所述多个时间段对应的所述对象的子向量,与所述对象的年龄特征进行拼接,得到所述对象的特征向量。6.根据权利要求1至5中任一项所述的方法,其中,对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇,包括:采用高斯混合模型对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇。7.根据权利要求1至6中任一项所述的方法,还包括:对所述对象所归属的类簇进行抽样分析,得到所述对象的标签。8.根据权利要求7所述的方法,其中,对所述对象所归属的类簇进行抽样分析,得到所述对象的标签,包括以下至少之一:根据时间特征对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签,所述时间特征包括第二时间范围内的定位频次;根据年龄特征对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签;根据定位次数对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签;
根据参考向量与所述对象的特征向量的相似性,对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签。9.根据权利要求1至8中任一项所述的方法,还包括:根据所述对象的标识添加所述对象的标签。10.一种分类装置,包括:特征向量模块,用于根据出现在目标区域内的对象的位置信息,得到所述对象的特征向量;聚类训练模块,用于对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇。11.根据权利要求10所述的装置,其中,所述对象的位置信息包括所述对象的定...
【专利技术属性】
技术研发人员:刘昊骋,孙倩,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。