【技术实现步骤摘要】
视频分类方法、装置、设备及存储介质
[0001]本专利技术涉及视频处理
,尤其涉及一种视频分类方法、装置、设备及存储介质。
技术介绍
[0002]如今,短视频行业快速发展,其中的难点之一是为每个短视频快速、准确地打上标签,好的短视频标签,对于用户的精准推荐具有非常大的帮助。基于AI(Artificial Intelligence,人工智能)的自动打标签技术,是目前短视频产品中比较常用的方法,通常是对短视频进行分类后再打上对应类别的标签,实现自动打标签。但由于短视频的时间短、图像信息少、视频质量参差不齐等特点,想要更具体、更复杂的分类层次,以打上更精准的标签尚有较大难度。现有技术的短视频分类方法,存在无法利用多层标签之间的依赖关系和特征联系,导致短视频的分类结果可能存在误差,精确度较低的问题。
技术实现思路
[0003]本专利技术的主要目的在于:提供一种视频分类方法、装置、设备及存储介质,旨在解决现有技术中的视频分类方法存在准确度较低的技术问题。
[0004]为实现上述目的,本专利技术采用如下技术 ...
【技术保护点】
【技术特征摘要】
1.一种视频分类方法,其特征在于,所述方法包括:获取待分类视频;对所述待分类视频进行特征提取和特征融合,得到多模态特征;对所述多模态特征进行标签分类,得到一级分类标签和二级分类标签;将所述一级分类标签对应的分支标签与所述二级分类标签进行融合,得到融合后的分类特征;根据所述融合后的分类特征,进行与所述二级分类标签对应的类别预测,得到视频分类结果。2.如权利要求1所述的视频分类方法,其特征在于,所述待分类视频包括文本数据和视频数据;所述对所述待分类视频进行特征提取和特征融合,得到多模态特征的步骤包括:根据所述文本数据和所述视频数据,进行文本模态特征提取,获得文本特征;根据所述视频数据,进行视频模态特征提取,获得视频特征;根据所述文本特征和所述视频特征,进行特征融合,得到多模态特征。3.如权利要求2所述的视频分类方法,其特征在于,所述根据所述文本数据和所述视频数据,进行文本模态特征提取,获得文本特征的步骤包括:对所述视频数据进行文本识别,获得第一文本;根据所述文本数据,确定第二文本;对所述第一文本和所述第二文本进行文本模态特征提取,获得文本特征。4.如权利要求3所述的视频分类方法,其特征在于,所述对所述视频数据进行文本识别,获得第一文本的步骤包括:将所述视频数据输入多级联目标检测模型,得到文本目标框;所述多级联目标检测模型基于样本生成数据对区域生成网络进行训练获得;根据所述文本目标框,对所述视频数据进行裁剪,得到文本图像;将所述文本图像输入文本识别模型,得到第一文本;所述文本识别模型基于双向长短期记忆神经网络训练获得。5.如权利要求2所述的视频分类方法,其特征在于,所述根据所述文本特征和所述视频特征,进行特征融合,得到多模态特征的步骤包括:利用聚类算法对所述视频特征进行降维处理,得到降维后的视频特征;对所述文本特征和所述降维后的视频特征进行特征融合,得到融合特征;确定所述融合特征的权重值;根据所述融合特征和所述融合特征的权重值,得到多模态特征。6.如权利要求1所述的视频分类方法,其特征在于,所述对所述多模态特征进行标签分类,得到一级分类标签和二级分类标签的步骤包括:在第一分类通道中,利用第一分类模型对所述多模态特征进行标签分类,得到一级分类标签;在第二分类通道中,利用第二分类模型对所述多模态...
【专利技术属性】
技术研发人员:徐鸣谦,王晓宇,顾明,饶明佺,刘倍余,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。