视频分类方法、装置、设备和存储介质制造方法及图纸

技术编号：29403598 阅读：12 留言：0更新日期：2021-07-23 22:41

本公开公开了一种视频分类方法、装置、设备和存储介质，涉及计算机技术领域，具体涉及知识图谱、计算机视觉、深度学习等人工智能技术领域。视频分类方法包括：根据视频的多模态信息，提取所述视频中的关键词；获取所述关键词对应的背景知识，并根据所述关键词和所述背景知识，确定待识别文本；对所述待识别文本进行分类，以得到所述视频的类别。本公开可以提高视频分类的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
视频分类方法、装置、设备和存储介质
本公开涉及计算机
，具体涉及知识图谱、计算机视觉、深度学习等人工智能
，尤其涉及一种视频分类方法、装置、设备和存储介质。
技术介绍
人工智能(ArtificialIntelligence，AI)是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。随着信息技术发展，视频成为承载信息传递的主要方式之一。随着视频数据的极速增长，可以对视频进行分类，以便基于分类对视频进行存储、管理等。相关技术中，通常是利用视频的单一模态信息对视频进行分类。
技术实现思路
本公开提供了一种视频分类方法、装置、设备和存储介质。根据本公开的一方面，提供了一种视频分类方法，包括：根据视频的多模态信息，提取所述视频中的关键词；获取所述关键词对应的背景知识，并根据所述关键词和所述背景知识，确定待识别文本；对所述待识别文本进行分类，以得到所述视频的类别。根据本公开的另一方面，提供了一种视频分类装置，包括：提取模块，用于根据视频的多模态信息，提取所述视频中的关键词；确定模块，用于获取所述关键词对应的背景知识，并根据所述关键词和所述背景知识，确定待识别文本；分类模块，用于...

【技术保护点】
1.一种视频分类方法，包括：/n根据视频的多模态信息，提取所述视频中的关键词；/n获取所述关键词对应的背景知识，并根据所述关键词和所述背景知识，确定待识别文本；/n对所述待识别文本进行分类，以得到所述视频的类别。/n

【技术特征摘要】
1.一种视频分类方法，包括：
根据视频的多模态信息，提取所述视频中的关键词；
获取所述关键词对应的背景知识，并根据所述关键词和所述背景知识，确定待识别文本；
对所述待识别文本进行分类，以得到所述视频的类别。

2.根据权利要求1所述的方法，其中，所述根据视频的多模态信息，提取所述视频中的关键词，包括：
分别对所述多模态信息中的各模态信息，进行特征提取，以得到所述各模态信息对应的特征；
对所述各模态信息对应的特征进行融合，以得到融合特征；
根据所述融合特征进行关键词标注，以确定所述视频中的关键词。

3.根据权利要求2所述的方法，其中，所述多模态信息包括：文本内容和视觉信息，所述视觉信息包括第一视觉信息和第二视觉信息，所述第一视觉信息为所述视频中的视频帧中的文本对应的视觉信息，所述第二视觉信息为所述视频中的关键帧，所述分别对所述多模态信息中的各模态信息，进行特征提取，以得到所述各模态信息对应的特征，包括：
对所述文本内容进行第一文本编码，以得到文本特征；
对所述第一视觉信息进行第二文本编码，以得到第一视觉特征；
对所述第二视觉信息进行图像编码，以得到第二视觉特征。

4.根据权利要求2所述的方法，其中，所述对所述各模态信息对应的特征进行融合，以得到融合特征，包括：
对所述各模态信息对应的特征进行向量拼接，以得到拼接向量，将所述拼接向量作为融合特征。

5.根据权利要求2所述的方法，其中，所述根据所述融合特征进行关键词标注，包括：
采用条件随机场，根据所述融合特征进行关键词标注。

6.根据权利要求1所述的方法，其中，所述获取所述关键词对应的背景知识，包括：
从已有的知识库中，获取所述关键词对应的背景知识。

7.根据权利要求1-6任一项所述的方法，其中，所述对所述待识别文本进行分类，包括：
采用分类模型，对所述待识别文本进行分类，所述分类模型采用广电数据训练后得到。

8.一种视频分类装置，包括：
提取模块，用于根据视频的多模态信息，提取所述视频中的关键词；
确定模块，用于获取所述关键词对应的背景知识，并根据所述关键词和所述背景知识，确定待识别文本；
分类模块，用...

【专利技术属性】
技术研发人员：杨虎，贺峰，汪琦，冯知凡，柴春光，朱勇，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人