短视频场景分类方法、系统、电子设备及存储介质技术方案

技术编号：30541876 阅读：16 留言：0更新日期：2021-10-30 13:19

本发明专利技术公开了一种短视频场景分类方法、系统、电子设备及存储介质，短视频场景分类方法包括：短视频图像处理步骤：对短视频图像进行抽帧提取获得多个视频帧，根据多个视频帧获得具有对应多个视频帧的多个图片信息的图像数据集；场景分类识别步骤：通过一经度量学习后的识别网络对图像数据集中的多个图片信息进行识别分类获得每一图片信息的图像概率；图像概率处理步骤：根据每一图片信息的图像概率计算获得短视频的每一场景类别的场景概率。本发明专利技术在基于图像级的场景分类的基础上，使用了度量学习的思想解决了同一类别特征层面的差距过大的问题，保证了最后的分类效果。保证了最后的分类效果。保证了最后的分类效果。

全部详细技术资料下载

【技术实现步骤摘要】
短视频场景分类方法、系统、电子设备及存储介质

[0001]本专利技术涉及视频处理
，特别涉及一种结合度量学习的短视频场景分类方法、系统、电子设备及存储介质。

技术介绍

[0002]随着科学技术的飞速发展，通讯技术得到了飞速的发展，目前的通讯技术已经发展到了第五代通信
‑‑‑
5G。5G技术的飞速发展带来了互联网信息传播的新途径
‑‑‑
短视频。短视频已经成为了目前社会生活下传播信息最丰富，最快捷，最受欢迎的途径。抖音短视频的月活数已经突破了两亿人次。各种其他的短视频APP也同样有着丰富的人气。如快手，腾讯微视，微信视频号等也有着非常丰富的月活人数。在这种丰富的月活人数下，各种短视频平台的数据量急剧上升，如何能够更好的使用丰富的短视频，并提取出有用的信息，进行数据分析也成为了一个新的技术课题。
[0003]与正常的场景分类不同，短视频场景分类主要面临两个问题需要进行解决：
[0004]一是与图像不同，一副图像中只会描述一种场景。如图1中，这幅图像就只是描述了室内的场景。而对于短视频而言，由于其是一个较长时间的故事，因此场景会发生切换；如图2所示，其场景由室内切换到室外，因此对于一个短视频内的场景要尽可能的将所有的场景都识别到；
[0005]二是与普通的场景识别不同，短视频场景下，周围环境信息的内容较为稀少，大部分均是人物占据主要区域，如图3，而且同一场景类别下的信息差异也比较明显，如同样是直播间的场景，但各个图像之间的差异比较大...

【技术保护点】

【技术特征摘要】
1.一种短视频场景分类方法，其特征在于，包括：短视频图像处理步骤：对短视频图像进行抽帧提取获得多个视频帧，根据多个所述视频帧获得具有对应多个所述视频帧的多个图片信息的图像数据集；场景分类识别步骤：通过一经度量学习后的识别网络对所述图像数据集中的多个所述图片信息进行识别分类获得每一所述图片信息的图像概率；图像概率处理步骤：根据每一所述图片信息的图像概率计算获得所述短视频的每一场景类别的场景概率。2.如权利要求1所述的短视频场景分类方法，其特征在于，所述短视频图像处理步骤包括：将所述短视频图像进行抽帧提取，获取到所述短视频图像的分辨率及多个所述视频帧，根据所述分辨率对所述视频帧进行抽样保存获得所述图像数据集。3.如权利要求1所述的短视频场景分类方法，其特征在于，所述场景分类识别步骤包括：样本图像数据集获取步骤：对样本短视频图像进行抽帧提取获得多个样本视频帧，根据多个所述样本视频帧获得具有对应多个所述样本视频帧的多个样本图片信息的样本图像数据集；样本图像数据集处理步骤：为所述样本图像数据集的每一所述样本图片信息匹配一个同一场景类别的第一图片信息及一个不同一场景类别的第二图片信息；图片向量获取步骤：将所述样本图片信息、所述第一图片信息及所述第二图片信息输入所述识别网络获得样本图片向量、第一图片向量及第二图片向量；度量学习步骤：对所述样本图片向量、所述第一图片向量及所述第二图片向量使用TripletLoss进行度量学习获得网络学习特征；图像概率输出步骤：所述识别网络根据所述网络学习特征对多个所述图片信息进行识别分类获得每一所述图片信息的图像概率。4.如权利要求3所述的短视频场景分类方法，其特征在于，所述图像概率处理步骤包括：根据每一场景类别的所有的所述图片信息的图像概率进行均值计算获得每一场景类别的场景概率。5.一种短视频场景分类系统，其特征在于，包括：短视频图像处理单元，对短视频图像进行抽帧提取获得多个视频帧，根据多个所述视频帧获得具有对应多个所述视频帧的多个图片信息的...

【专利技术属性】
技术研发人员：朱彦浩，胡郡郡，唐大闰，
申请(专利权)人：上海明略人工智能集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人