分类方法、装置、设备以及存储介质制造方法及图纸

技术编号:33090875 阅读:37 留言:0更新日期:2022-04-15 11:04
本公开提供了一种分类方法、装置、设备以及存储介质。涉及计算机技术领域,尤其涉及大数据、数据挖掘、机器学习等领域。具体实现方案为:根据出现在目标区域内的对象的位置信息,得到该对象的特征向量;对该对象的特征向量进行聚类训练,得到该对象所归属的类簇。本公开实施例,能够对利用出现在目标区域内的对象的位置信息,准确地对该对象进行分类。准确地对该对象进行分类。准确地对该对象进行分类。

【技术实现步骤摘要】
分类方法、装置、设备以及存储介质


[0001]本公开涉及计算机
,尤其涉及大数据、数据挖掘、机器学习等领域。

技术介绍

[0002]在对各种平台的使用者等进行标签化过程中,许多类型的标签,需要依赖人工收集标签的样本。因此,收集过程需要花费较长的时间,并且,所需的人力成本较多。

技术实现思路

[0003]本公开提供了一种分类方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种分类方法,包括:
[0005]根据出现在目标区域内的对象的位置信息,得到该对象的特征向量;
[0006]对该对象的特征向量进行聚类训练,得到该对象所归属的类簇。
[0007]根据本公开的另一方面,提供了一种分类装置,包括:
[0008]特征向量模块,用于根据出现在目标区域内的对象的位置信息,得到该对象的特征向量;
[0009]聚类训练模块,用于对该对象的特征向量进行聚类训练,得到该对象所归属的类簇。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:
[0011]至少一个处理器;以及
[0012]与该至少一个处理器通信连接的存储器;其中,
[0013]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例的方法。
[0014]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行本公开任一实施例的方法。
[0015]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现本公开任一实施例的方法。
[0016]本公开实施例,能够对利用出现在目标区域内的对象的位置信息,准确地对该对象进行分类。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1是根据本公开一实施例的分类方法的流程示意图;
[0020]图2是根据本公开另一实施例的分类方法的流程示意图;
[0021]图3是根据本公开另一实施例的分类方法的流程示意图;
[0022]图4是根据本公开另一实施例的分类方法的流程示意图;
[0023]图5是根据本公开另一实施例的分类方法的流程示意图;
[0024]图6是根据本公开一实施例的分类装置的结构示意图;
[0025]图7是根据本公开另一实施例的分类装置的结构示意图;
[0026]图8是根据本公开另一实施例的分类装置的结构示意图;
[0027]图9是根据本公开实施例中特征生成的流程示意图;
[0028]图10a是根据本公开实施例中生成定位名称向量的示意图;
[0029]图10b是根据本公开实施例中生成特征向量的示意图;
[0030]图10c是根据本公开实施例中向量拼接的一种示例的示意图;
[0031]图10d是根据本公开实施例中向量拼接的另一种示例的示意图;
[0032]图11是根据本公开实施例中类别划分的流程示意图;
[0033]图12是根据本公开实施例的聚类训练的流程示意图;
[0034]图13是用来实现本公开实施例的分类方法的电子设备的框图。
具体实施方式
[0035]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0036]图1是根据本公开一实施例的分类方法的流程示意图。该方法可以包括:
[0037]S101、根据出现在目标区域内的对象的位置信息,得到该对象的特征向量;
[0038]S102、对该对象的特征向量进行聚类训练,得到该对象所归属的类簇。
[0039]在本公开实施例中,目标区域可以包括需要进行对象分配的区域。该区域的具体范围可以选定,也可以根据区域的特征自动确定。例如,如果目标区域是学校、商场、食堂等,可以利用地图等应用程序自动确定目标区域所包括的位置范围。如果需要对出现在目标区域的各个对象进行分类,可以通过例如地图或通信运营商等的定位服务获取出现在目标区域内的各个对象的位置信息。对象可以包括能够使用定位服务的用户。例如某应用程序或网络平台的能够使用定位服务的用户。一个对象在目标区域内可能包括多个位置信息,例如在不同的时间,该对象出现在目标区域内的不同位置或者该对象在相同位置多次定位。对该对象的每个位置信息进行分词等处理,得到该对象的特征向量。如果有多个对象,可以得到每个对应的特征向量。然后对一个或多个对象的特征向量进行聚类训练,可以得到每个对象所归属的类簇。
[0040]本公开实施例的分类方法,能够对利用出现在目标区域内的对象的位置信息,准确地对该对象进行分类。
[0041]图2是根据本公开另一实施例的分类方法的流程示意图。该分类方法可以包括上述方法实施例的一个或多个特征。在一种实施方式中,该对象的位置信息包括该对象的定位名称,S101根据出现在目标区域内的对象的位置信息,得到该对象的特征向量,包括:
[0042]S201、根据该对象的定位名称,得到该对象的定位名称向量;
[0043]S202、根据第一时间范围内出现在该目标区域内该对象的定位名称向量,得到该
对象的特征向量。
[0044]在本公开实施例中,对象的位置信息可以包括对象的定位名称。如果某个对象在目标区域内的兴趣点(Point of Interest,POI)或者相对固定的位置进行定位,可以将这个POI或者相对固定的位置的名称例如,建筑物、标志物等的名称,作为该对象的定位名称。每个定位名称可以转换为一个定位名称向量。如果在第一时间范围内,一个对象在目标区域内具有多个定位名称,可以基于这多个定位名称转换得到的定位名称向量,得到该对象的特征向量。
[0045]在本公开实施例中,第一时间范围可以根据实际应用场景的需求灵活选择,例如,一年、半年、1个月、1天等。
[0046]在本公开实施例中,能够利用第一时间范围内出现在目标区域内的对象的定位名称,得到定位名称向量,进而得到对象的特征向量,有利于后续准确地对该对象进行分类,提高分类效率。
[0047]图3是根据本公开另一实施例的分类方法的流程示意图。该分类方法可以包括上述方法实施例的一个或多个特征。在一种实施方式中,S201根据该对象的定位名称,得到该对象的定位名称向量,包括:
[0048]S301、将该对象的定位名称的所有分词的词向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类方法,包括:根据出现在目标区域内的对象的位置信息,得到所述对象的特征向量;对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇。2.根据权利要求1所述的方法,其中,所述对象的位置信息包括所述对象的定位名称,根据出现在目标区域内的对象的位置信息,得到所述对象的特征向量,包括:根据所述对象的定位名称,得到所述对象的定位名称向量;根据第一时间范围内出现在所述目标区域内所述对象的定位名称向量,得到所述对象的特征向量。3.根据权利要求2所述的方法,其中,根据所述对象的定位名称,得到所述对象的定位名称向量,包括:将所述对象的定位名称的所有分词的词向量求和平均,得到所述对象的定位名称向量。4.根据权利要求2或3所述的方法,其中,所述第一时间范围包括多个时间段,根据第一时间范围内出现在所述目标区域内所述对象的定位名称向量,得到所述对象的特征向量,包括:将每个时间段内包括的所述对象的多个定位名称向量求和平均,得到每个时间段对应的所述对象的子向量;将所述多个时间段对应的所述对象的子向量进行拼接,得到所述对象的特征向量。5.根据权利要求2或3所述的方法,其中,所述第一时间范围包括多个时间段,根据第一时间范围内出现在所述目标区域内所述对象的定位名称向量,得到所述对象的特征向量,包括:将每个时间段内包括的所述对象的多个定位名称向量求和平均,得到每个时间段对应的所述对象的子向量;将所述多个时间段对应的所述对象的子向量,与所述对象的年龄特征进行拼接,得到所述对象的特征向量。6.根据权利要求1至5中任一项所述的方法,其中,对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇,包括:采用高斯混合模型对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇。7.根据权利要求1至6中任一项所述的方法,还包括:对所述对象所归属的类簇进行抽样分析,得到所述对象的标签。8.根据权利要求7所述的方法,其中,对所述对象所归属的类簇进行抽样分析,得到所述对象的标签,包括以下至少之一:根据时间特征对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签,所述时间特征包括第二时间范围内的定位频次;根据年龄特征对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签;根据定位次数对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签;
根据参考向量与所述对象的特征向量的相似性,对所述对象所归属的类簇进行抽样分析,确定所述对象所归属的类簇对应的标签,作为所述对象的标签。9.根据权利要求1至8中任一项所述的方法,还包括:根据所述对象的标识添加所述对象的标签。10.一种分类装置,包括:特征向量模块,用于根据出现在目标区域内的对象的位置信息,得到所述对象的特征向量;聚类训练模块,用于对所述对象的特征向量进行聚类训练,得到所述对象所归属的类簇。11.根据权利要求10所述的装置,其中,所述对象的位置信息包括所述对象的定...

【专利技术属性】
技术研发人员:刘昊骋孙倩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1