视频分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33780413 阅读:26 留言:0更新日期:2022-06-12 14:34
本发明专利技术提供了一种视频分类方法、装置、电子设备及存储介质,该方法包括:获取待处理的目标视频;通过人工智能模型从所述目标视频中识别出目标文本;通过文本分类模型将所述目标文本划分为多种子文本;其中,所述文本分类模型由携带有标签类型的训练文本训练分类器得到;提取每种子文本对应的文本特征;根据所述多种子文本对应的多个文本特征确定所述目标视频的视频类别。本发明专利技术通过人工智能模型从视频中识别出目标文本数据,然后将目标文本进行更细粒度划分,得到多种子文本,根据子文本对应的文本特征标识目标视频的视频类别,提高了视频分类的准确率。视频分类的准确率。视频分类的准确率。

【技术实现步骤摘要】
视频分类方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,具体而言,涉及一种视频分类方法、装置、电子设备及存储介质。

技术介绍

[0002]近几年来,随着互联网技术的快速发展,互联网社交平台也得到了快速发展,各种短视频直播平台深受不同规模城市、不同年龄段的人群的追捧,每分钟就会有成千上万的短视频出现,这些短视频由于地域场景的不同,有共性的同时也有个性,因此,对短视频的类别进行准确分类也是一项重要的问题。
[0003]科学技术的不断进步,人工智能技术也快速发展,基于多模态技术的研究也越来越多,视频、文本等多模态技术也在不断发展,只有对短视频进行正确的分类,才能与时俱进,满足用户的体验,提供更好的服务。
[0004]当前常用的短视频分类方法,有的通过OCR提取短视频中的文本特征来进行分类,但是采用OCR处理方式缺点是简单粗暴,提取到的文本里含有大量的无效文本,会增加短视频识别的噪声,导致对短视频的分类不准确。此外,还有利用ASR技术,将视频的音频转化为文本,该方法的缺点是ASR提取的文本中也会包含噪声,并且有的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频分类方法,其特征在于,所述方法包括:获取待处理的目标视频;通过人工智能模型从所述目标视频中识别出目标文本;通过文本分类模型将所述目标文本划分为多种子文本;其中,所述文本分类模型由携带有标签类型的训练文本训练分类器得到;提取每种子文本对应的文本特征;根据所述多种子文本对应的多个文本特征确定所述目标视频的视频类别。2.根据权利要求1所述的方法,其特征在于,所述人工智能模型包括用于进行语音识别的第一人工智能模型和用于进行字符识别的第二人工智能模型,所述通过人工智能模型从所述目标视频中识别出目标文本至少包括以下之一:通过所述第一人工智能模型从所述目标视频中识别出音频信息,并将所述音频信息转换为第一文本;基于预设的抽帧策略从所述目标视频中抽取视频帧图像,经由所述第二人工智能模型识别出所述帧图像中包含的文字信息,并将所述文字信息转换为第二文本。3.根据权利要求2所述的方法,其特征在于,所述通过文本分类模型将所述目标文本划分为多种子文本至少包括以下之一:所述训练文本的标签类型至少包括用于标记视频中背景音的第一类标签和用于标记视频中主体音的第二类标签,将所述第一文本输入所述文本分类模型,以得到标签类型为所述第一类标签的第一子文本和标签类型为所述第二类标签的第二子文本;所述训练文本的标签类型至少包括用于标记视频帧图像中的字幕的第三类标签和用于标记视频帧图像中的版面的第四类标签,将所述第二文本输入所述文本分类模型,以得到标签类型为所述第三类标签的第三子文本和标签类型为所述第四类标签的第四子文本。4.根据权利要求1所述的方法,其特征在于,在提取每种子文本对应的文本特征之后,所述方法还包括:将所述多种子文本中没被选过的目标子文本对应的目标文本特征与预设文本携带的预设标签进行比较;若所述目标文本特征与所述预设标签属于相同的类别,则所述目标子文本与所述目标文本特征对应;否则,所述目标子文本与所述目标文本特征不对应,并确定为所述目标视频中不存在所述目标子文本。5.根据权利要求1所述的方法,其特征在于,根据所述多种子文本对应的多个文本特征确定所述目标视频的视频类...

【专利技术属性】
技术研发人员:赵波胡郡郡唐大闰
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1