【技术实现步骤摘要】
一种对象分类方法、装置、存储介质及计算机设备
本专利技术涉及对象分类领域,尤其涉及一种对象分类方法、装置、存储介质及计算机设备。
技术介绍
随着互联网的发展,视频网站上可供观看的视频也越来越多。电影播单是具有一定相似性的电影列表,如:警察故事系列电影播单,该播单中包括成龙主演的多部警察故事系列电影。通过电影播单,视频网站浏览者可以快速找到自己所需的多个电影并进行观看。但现有技术需要通过人工对各个电影进行整理从而得到电影播单。由于电影数量巨大,因此人工制作电影播单的效率较低。同时,一个电影携带的标签可能很多(如:香港、成龙、警匪、喜剧等),通过人工无法根据这些标签对电影进行准确的分类。
技术实现思路
鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种对象分类方法、装置、存储介质及计算机设备,技术方案如下:一种对象分类方法,包括:获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则将所述综合聚度最小的对象子集确定为一个新的已分 ...
【技术保护点】
1.一种对象分类方法,其特征在于,包括:获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。
【技术特征摘要】
1.一种对象分类方法,其特征在于,包括:获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。2.根据权利要求1所述的方法,其特征在于,在所述从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集之后,所述方法还包括:将所述综合聚度最小的对象子集中的各对象从当前待分类对象集合中删除,将所述综合聚度最小的对象子集对应的标签从当前标签集合中删除。3.根据权利要求2所述的方法,其特征在于,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,所述方法还包括:将所述初始待分类对象集合确定为一个已分类对象子集,将该已分类对象子集确定为当前待分类对象集合,将所述当前待分类对象集合中各对象对应的标签中除与该已分类对象子集对应的标签外的其他标签中的至少部分标签确定为一个当前标签集合;返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:如果所述综合聚度最小的对象子集分别与各已分类对象子集的相似度未均满足预设相似度要求,则将所述综合聚度最小的对象子集中各对象放入相似度最高的已分类对象子集中,建立所述综合聚度最小的对象子集对应的标签与所述相似度最高的已分类对象子集的对应关系。6.根据权利要求1所述的方法,其特征在于,所述对象子集的综合聚度的确定过程包括:获得对象子集与各已分类对象子集的并集;确定所述并集的标签内聚度和标签外聚度;根据所述标签内聚度和标签外聚度确定对象子集的综合聚度。7.根据权利要求6所述的方法,其特征在于,所述确定所述并集的标签内聚度,包括:根据公式确定所述并集的标签内聚度TagSamGroup(G),其中,G为所述并集,l为G中包含的对象子集的数量,Gk为G中的编号为k的对象子集,mi为Gk中编号为i的对象,mj为Gk中编号为j的对象,ti为当前标签集合中与mi对应的标签,tj为当前标签集合中与mj对应的标签,|ti∩tj|为ti与tj的交集中标签的数量,|ti∪tj|...
【专利技术属性】
技术研发人员:宁宇光,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。