一种对象分类方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:22135338 阅读:25 留言:0更新日期:2019-09-18 09:02
本发明专利技术公开了一种对象分类方法、装置、存储介质及计算机设备,可以获得当前待分类对象集合;将当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求;如果是,则将综合聚度最小的对象子集确定为一个新的已分类对象子集。本发明专利技术可以自动对对象进行分类,无需人工参与,更加快捷和准确。

An Object Classification Method, Device, Storage Media and Computer Equipment

【技术实现步骤摘要】
一种对象分类方法、装置、存储介质及计算机设备
本专利技术涉及对象分类领域,尤其涉及一种对象分类方法、装置、存储介质及计算机设备。
技术介绍
随着互联网的发展,视频网站上可供观看的视频也越来越多。电影播单是具有一定相似性的电影列表,如:警察故事系列电影播单,该播单中包括成龙主演的多部警察故事系列电影。通过电影播单,视频网站浏览者可以快速找到自己所需的多个电影并进行观看。但现有技术需要通过人工对各个电影进行整理从而得到电影播单。由于电影数量巨大,因此人工制作电影播单的效率较低。同时,一个电影携带的标签可能很多(如:香港、成龙、警匪、喜剧等),通过人工无法根据这些标签对电影进行准确的分类。
技术实现思路
鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种对象分类方法、装置、存储介质及计算机设备,技术方案如下:一种对象分类方法,包括:获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。可选的,在所述从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集之后,所述方法还包括:将所述综合聚度最小的对象子集中的各对象从当前待分类对象集合中删除,将所述综合聚度最小的对象子集对应的标签从当前标签集合中删除。可选的,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。可选的,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,所述方法还包括:将所述初始待分类对象集合确定为一个已分类对象子集,将该已分类对象子集确定为当前待分类对象集合,将所述当前待分类对象集合中各对象对应的标签中除与该已分类对象子集对应的标签外的其他标签中的至少部分标签确定为一个当前标签集合;返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。可选的,所述方法还包括:如果所述综合聚度最小的对象子集分别与各已分类对象子集的相似度未均满足预设相似度要求,则将所述综合聚度最小的对象子集中各对象放入相似度最高的已分类对象子集中,建立所述综合聚度最小的对象子集对应的标签与所述相似度最高的已分类对象子集的对应关系。可选的,所述对象子集的综合聚度的确定过程包括:获得对象子集与各已分类对象子集的并集;确定所述并集的标签内聚度和标签外聚度;根据所述标签内聚度和标签外聚度确定对象子集的综合聚度。可选的,所述确定所述并集的标签内聚度,包括:根据公式确定所述并集的标签内聚度TagSamGroup(G),其中,G为所述并集,l为G中包含的对象子集的数量,Gk为G中的编号为k的对象子集,mi为Gk中编号为i的对象,mj为Gk中编号为j的对象,ti为当前标签集合中与mi对应的标签,tj为当前标签集合中与mj对应的标签,|ti∩tj|为ti与tj的交集中标签的数量,|ti∪tj|为ti与tj的并集中标签的数量,TagSim(mi,mj)为对象mi和对象mj的标签相似度,|Gk|2为Gk中包含的对象的数量的平方,TagSamGroup(Gk)为Gk内各对象的标签相似度的综合值。可选的,所述并集的标签外聚度的确定过程包括:根据公式确定所述并集的标签外聚度MovieSim(G),其中,Gi为G中编号为i的对象子集,Gj为G中编号为j的对象子集、为当前标签集合中与Gi中各对象对应的标签的集合,为当前标签集合中与Gj中各对象对应的标签的集合,为与的交集中标签的数量,为与的并集中标签的数量,MGroupSim(Gi,Gj)为Gi与Gj的标签相似度。可选的,所述根据所述标签内聚度和标签外聚度确定对象子集的综合聚度,包括:根据公式确定对象子集的综合聚度Target(G)。一种对象分类装置,包括:集合获得单元、集合确定单元、第一子集确定单元、第二子集确定单元、相似度确定单元和子集分类单元,所述集合获得单元,用于获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;所述集合确定单元,用于将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;所述第一子集确定单元,用于对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;所述第二子集确定单元,用于从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;所述相似度确定单元,用于确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则触发所述子集分类单元;所述子集分类单元,用于将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现任一种对象分类方法。一种计算机设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述处理器执行程序时至少实现以下步骤:获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。借由上述技术方案,本专利技术提供的一种对象分类方法、装置、存储介质及计算机设备,可以获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的本文档来自技高网...

【技术保护点】
1.一种对象分类方法,其特征在于,包括:获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。

【技术特征摘要】
1.一种对象分类方法,其特征在于,包括:获得当前待分类对象集合,所述当前待分类对象集合中包括多个对象,每个对象对应有至少一个标签,所述当前待分类对象集合为初始待分类对象集合的子集;将所述当前待分类对象集合中各对象对应的标签中的至少部分标签确定为一个当前标签集合;对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集;从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集;确定所述综合聚度最小的对象子集分别与各已分类对象子集的相似度是否均满足预设相似度要求,其中,所述各已分类对象子集均为所述初始待分类对象集合的子集;如果是,则将所述综合聚度最小的对象子集确定为一个新的已分类对象子集。2.根据权利要求1所述的方法,其特征在于,在所述从当前待分类对象集合的各对象子集中确定综合聚度最小的对象子集之后,所述方法还包括:将所述综合聚度最小的对象子集中的各对象从当前待分类对象集合中删除,将所述综合聚度最小的对象子集对应的标签从当前标签集合中删除。3.根据权利要求2所述的方法,其特征在于,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述将所述综合聚度最小的对象子集确定为一个新的已分类对象子集之后,所述方法还包括:将所述初始待分类对象集合确定为一个已分类对象子集,将该已分类对象子集确定为当前待分类对象集合,将所述当前待分类对象集合中各对象对应的标签中除与该已分类对象子集对应的标签外的其他标签中的至少部分标签确定为一个当前标签集合;返回执行所述对当前标签集合中的至少一个标签:将与该标签对应且位于当前待分类对象集合中的各对象确定为当前待分类对象集合的一个与该标签对应的对象子集的步骤。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:如果所述综合聚度最小的对象子集分别与各已分类对象子集的相似度未均满足预设相似度要求,则将所述综合聚度最小的对象子集中各对象放入相似度最高的已分类对象子集中,建立所述综合聚度最小的对象子集对应的标签与所述相似度最高的已分类对象子集的对应关系。6.根据权利要求1所述的方法,其特征在于,所述对象子集的综合聚度的确定过程包括:获得对象子集与各已分类对象子集的并集;确定所述并集的标签内聚度和标签外聚度;根据所述标签内聚度和标签外聚度确定对象子集的综合聚度。7.根据权利要求6所述的方法,其特征在于,所述确定所述并集的标签内聚度,包括:根据公式确定所述并集的标签内聚度TagSamGroup(G),其中,G为所述并集,l为G中包含的对象子集的数量,Gk为G中的编号为k的对象子集,mi为Gk中编号为i的对象,mj为Gk中编号为j的对象,ti为当前标签集合中与mi对应的标签,tj为当前标签集合中与mj对应的标签,|ti∩tj|为ti与tj的交集中标签的数量,|ti∪tj|...

【专利技术属性】
技术研发人员:宁宇光
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1