一种聚类方法及装置制造方法及图纸

技术编号:24206760 阅读:69 留言:0更新日期:2020-05-20 14:59
本申请提供一种聚类方法,包括,获得第一视频数据;对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据;基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件下,对所述第一视频数据和第二视频数据进行聚类;根据所述聚类的结果进行管理。同时,本申请还提供一种聚类装置。

A clustering method and device

The application provides a clustering method, which includes: obtaining the first video data; analyzing the first video data to obtain the first audio feature data and the first scene feature data of the first video data; determining that the first video data and the second video data meet the first predetermined conditions based on the first audio feature data and the first scene feature data And clustering the first video data and the second video data, and managing according to the clustering results. At the same time, the application also provides a clustering device.

【技术实现步骤摘要】
一种聚类方法及装置
本专利技术涉及视频处理技术,尤其涉及一种针对视频数据的聚类方法及装置。
技术介绍
随着终端存储容量的提升,用户可以在终端内存储若干个音频、视频、图片等文件,但随着音、视频文件的增多,用户无法快速的在若干个音、视频文件中找到目标音、视频文件。
技术实现思路
为解决上述问题,本专利技术的技术方案是这样实现的:根据本申请的一方面,提供一种聚类方法,包括,获得第一视频数据;对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据;基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件下,对所述第一视频数据和第二视频数据进行聚类;根据所述聚类的结果进行管理。上述方案中,所述基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件,包括:基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据的第一属性;在所述第一属性和第二视频数据的第二属性满足相同条件的情况下,确定所述第一视频数据与所述第二视频数据满足第一预定条件。上述方案中,在所述第一属性和第二视频数据的第二属性满足相同条件的情况下,所述方法还包括:获得所述第一视频数据的第一语义数据;基于所述第一语义数据确定所述第一视频数据是预设类型数据的情况下,确定所述第一视频数据与所述第二视频数据满足第一预定条件;所述预设类型数据包括学习类型、工作类型、旅游类型、运动类型、聚会类型中的至少一种。上述方案中,在所述对所述第一视频数据和第二视频数据进行聚类之前,所述方法还包括:获得所述第一音频特征数据在所述第一视频数据中所占的第一声音比重;在所述第一声音比重满足第二预定条件下,对所述第一视频数据和所述第二视频数据进行聚类;所述第二预定条件表征所述第一声音比重是所述第一视频数据中的最大声音比重。上述方案中,所述对所述第一视频数据和第二视频数据进行聚类,包括:为所述第一视频数据和所述第二视频数据构建第一标签;基于所述第一标签将所述第一视频数据和所述第二视频数据标记为同类别文件。上述方案中,所述对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据,包括:对所述第一视频数据进行分析,得到一个第一音频特征数据和多个不同的第一场景特征数据的情况下,基于多个不同的所述第一场景特征数据对所述第一视频数据进行视频分割,得到多个第三视频数据,每个第三视频数据对应于一个第一场景特征数据;基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第三视频数据与所述第二视频数据满足第一预定条件下,对满足所述第一预定条件的至少一个第三视频数据和所述第二视频数据进行聚类;或者,对所述第一视频数据进行分析,得到多个不同的第一音频特征数据和多个不同的第一场景特征数据的情况下,基于多个不同的所述第一音频特征数据和多个不同的所述第一场景特征数据对所述第一视频数据进行视频分割,得到多个第四视频数据,每个第四视频数据对应于一个第一音频特征数据和\或一个第一场景特征数据;基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第四视频数据与所述第二视频数据满足第一预定条件下,对满足所述第一预定条件的至少一个第四视频数据和所述第二视频数据进行聚类;或者,对所述第一视频数据进行分析,得到多个不同的第一音频特征数据和一个第一场景特征数据的情况下,基于多个不同的所述第一音频特征数据对所述第一视频数据进行视频分割,得到多个第五视频数据,每个第五视频数据对应于一个第一音频特征数据;基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第五视频数据与所述第二视频数据满足第一预定条件下,对满足所述第一预定条件的至少一个第五视频数据和所述第二视频数据进行聚类。上述方案中,在所述得到多个第三视频数据之后,所述方法还包括:基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第三视频数据与所述第二视频数据不满足所述第一预定条件下,对不满足所述第一预定条件的至少一个第三视频数据构建第二标签;基于所述第二标签将不满足所述第一预定条件的至少一个第三视频数据标记为不同类别文件;或者,在所述得到多个第四视频数据之后,所述方法还包括:基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第四视频数据与所述第二视频数据不满足所述第一预定条件下,对不满足所述第一预定条件的至少一个第四视频数据构建第二标签;基于所述第二标签将不满足所述第一预定条件的至少一个第四视频数据标记为不同类别文件;或者,在所述得到多个第五视频数据之后,所述方法还包括:基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第五视频数据与所述第二视频数据不满足第一预定条件下,对不满足所述第一预定条件的至少一个第五视频数据构建第二标签;基于所述第二标签将不满足所述第一预定条件的至少一个第五视频数据标记为不同类别文件。上述方案中,所述获得第一视频数据,包括:在所述第一视频数据的录制过程中每隔预设时间,获得所述第一视频数据;或者,在所述第一视频数据录制完成的情况下,获得所述第一视频数据。上述方案中,所述根据所述聚类的结果进行管理,包括:响应于文件的合并操作,将至少两个第一聚类文件合并成一个第二聚类文件,所述至少一个第一聚类文件中包括所述第一视频数据和所述第二视频数据;或者,响应于文件的删除操作,将所述第二聚类文件中包括的至少一个所述第一聚类文件删除;或者,响应于文件的拼接操作,对至少两个第一聚类文件进行文件拼接,形成第二聚类文件,所述第二聚类文件中包括各所述第一聚类文件的视频数据;或者,响应于视频数据的合并操作,将所述第一视频数据和所述第二视频数据进行数据合并,形成第一聚类文件;或者,响应于视频数据的删除操作,将所述第一聚类文件中的至少一个视频数据删除;或者,响应于视频数据的拼接操作,将所述第一视频数据和所述第二视频数据进行数据拼接,形成第一聚类文件。根据本申请的另一方面,提供一种聚类装置,包括:获取单元,用于获得第一视频数据;分析单元,用于对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据;聚类单元,用于基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件下,对所述第一视频数据和第二视频数据进行聚类,并根据所述聚类的结果进行管理。本专利技术实施例提供一种聚类方法及装置,通过获得第一数据的第一音频特征数据;如果所述第一音频特征数据和目标数据的第二音频特征数据相同,合并所述第一数据和所述目标数据。如此,通过音频特征数据的匹配,将相同类型的数据聚类在一起,方便用户快本文档来自技高网...

【技术保护点】
1.一种聚类方法,包括,/n获得第一视频数据;/n对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据;/n基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件下,对所述第一视频数据和第二视频数据进行聚类;根据所述聚类的结果进行管理。/n

【技术特征摘要】
1.一种聚类方法,包括,
获得第一视频数据;
对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据;
基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件下,对所述第一视频数据和第二视频数据进行聚类;根据所述聚类的结果进行管理。


2.根据权利要求1所述的方法,所述基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据与第二视频数据满足第一预定条件,包括:
基于所述第一音频特征数据和所述第一场景特征数据确定所述第一视频数据的第一属性;
在所述第一属性和第二视频数据的第二属性满足相同条件的情况下,确定所述第一视频数据与所述第二视频数据满足第一预定条件。


3.根据权利要求2所述的方法,在所述第一属性和第二视频数据的第二属性满足相同条件的情况下,所述方法还包括:
获得所述第一视频数据的第一语义数据;
基于所述第一语义数据确定所述第一视频数据是预设类型数据的情况下,确定所述第一视频数据与所述第二视频数据满足第一预定条件;
所述预设类型数据包括学习类型、工作类型、旅游类型、运动类型、聚会类型中的至少一种。


4.根据权利要求1所述的方法,在所述对所述第一视频数据和第二视频数据进行聚类之前,所述方法还包括:
获得所述第一音频特征数据在所述第一视频数据中所占的第一声音比重;
在所述第一声音比重满足第二预定条件下,对所述第一视频数据和所述第二视频数据进行聚类;
所述第二预定条件表征所述第一声音比重是所述第一视频数据中的最大声音比重。


5.根据权利要求1所述的方法,所述对所述第一视频数据和第二视频数据进行聚类,包括:
为所述第一视频数据和所述第二视频数据构建第一标签;
基于所述第一标签将所述第一视频数据和所述第二视频数据标记为同类别文件。


6.根据权利要求1所述的方法,所述对所述第一视频数据进行分析,得到所述第一视频数据的第一音频特征数据和第一场景特征数据,包括:
对所述第一视频数据进行分析,得到一个第一音频特征数据和多个不同的第一场景特征数据的情况下,基于多个不同的所述第一场景特征数据对所述第一视频数据进行视频分割,得到多个第三视频数据,每个第三视频数据对应于一个第一场景特征数据;
基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第三视频数据与所述第二视频数据满足第一预定条件下,对满足所述第一预定条件的至少一个第三视频数据和所述第二视频数据进行聚类;
或者,对所述第一视频数据进行分析,得到多个不同的第一音频特征数据和多个不同的第一场景特征数据的情况下,基于多个不同的所述第一音频特征数据和多个不同的所述第一场景特征数据对所述第一视频数据进行视频分割,得到多个第四视频数据,每个第四视频数据对应于一个第一音频特征数据和\或一个第一场景特征数据;
基于所述第一音频特征数据和所述第一场景特征数据确定至少一个所述第四视频数据与所述第二视频数据满足第一预定条件下,对满足所述第一预定条件的至少一个第四视频数据和所述第二视频数据进行聚类;
或者,对所述第一视频数据进行分析,得到多个不同...

【专利技术属性】
技术研发人员:蔡明祥
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1