The aim of the invention is to provide a method and device for acquiring video semantic information. The present invention determines the visual object contained in the video frame by extracting the object from the video frame, then determines the scene information corresponding to the one or more video frames according to the object characteristics corresponding to the visual object, and finally determines the video frame of the video according to the scene information. The corresponding video semantic information. Compared with the prior art, the invention can automatically acquire detailed and complete video semantic information based on video, save a large number of human resources for video semantic acquisition, and at the same time, the acquired video semantic information can be convenient for subsequent video analysis or search.
【技术实现步骤摘要】
一种用于获取视频语义信息的方法与装置
本专利技术涉及视频
,尤其涉及一种用于获取视频语义信息的技术。
技术介绍
当前,获取视频内容的方法主要包括:根据视频介绍来获取,或是通过对视频内容进行分析后获取。前者主要是基于视频简介,而视频简介所覆盖的视频内容有限,无法反应视频内容的具体细节;后者则主要是对视频画面进行人物识别以及情绪识别,因此,所还原的视频信息有限,无法完整地还原视频所对应的具体语义信息。因此,如何能够获取详细的视频语义信息,进一步支持视频的应用,成为了本领域技术人员亟待解决的问题之一。
技术实现思路
本专利技术的目的是提供一种用于获取视频语义信息的方法与设备。根据本专利技术的一个实施例,提供了一种用于获取视频语义信息的方法,其中,该方法包括以下步骤:提取视频中的一个或多个视频帧;对所述视频帧进行目标提取,以确定所述视频帧中所包含的视觉对象;根据所述视觉对象所对应的对象特征,以确定所述一个或多个视频帧所对应的场景信息;根据所述场景信息,确定所述视频的视频帧所对应的视频语义信息。可选地,提取视频中的一个或多个视频帧的步骤包括:提取视频中的多个视频帧,其中,所述多个视频帧是连续的。可选地,该方法还包括:对视频进行场景分割;其中,提取视频中的多个视频帧的步骤包括:根据所述视频中所对应的场景,提取所述视频中的多个视频帧,其中,所述多个视频帧是连续的且对应于同一场景。可选地,提取视频中的一个或多个视频帧的步骤包括:当满足一个或多个触发条件时,提取视频中的一个或多个视频帧;其中,所述触发条件包括以下至少任一项:根据所述视频的播放时间长度触发;根据所述视频的播 ...
【技术保护点】
1.一种用于获取视频语义信息的方法,其中,该方法包括以下步骤:提取视频中的一个或多个视频帧;对所述视频帧进行目标提取,以确定所述视频帧中所包含的视觉对象;根据所述视觉对象所对应的对象特征,以确定所述一个或多个视频帧所对应的场景信息;根据所述场景信息,确定所述视频的视频帧所对应的视频语义信息。
【技术特征摘要】
1.一种用于获取视频语义信息的方法,其中,该方法包括以下步骤:提取视频中的一个或多个视频帧;对所述视频帧进行目标提取,以确定所述视频帧中所包含的视觉对象;根据所述视觉对象所对应的对象特征,以确定所述一个或多个视频帧所对应的场景信息;根据所述场景信息,确定所述视频的视频帧所对应的视频语义信息。2.根据权利要求1所述的方法,其中,提取视频中的一个或多个视频帧的步骤包括:提取视频中的多个视频帧,其中,所述多个视频帧是连续的。3.根据权利要求2所述的方法,其中,该方法还包括:对视频进行场景分割;其中,提取视频中的多个视频帧的步骤包括:根据所述视频中所对应的场景,提取所述视频中的多个视频帧,其中,所述多个视频帧是连续的且对应于同一场景。4.根据权利要求1至3中任一项所述的方法,其中,提取视频中的一个或多个视频帧的步骤包括:当满足一个或多个触发条件时,提取视频中的一个或多个视频帧;其中,所述触发条件包括以下至少任一项:根据所述视频的播放时间长度触发;根据所述视频的播放时间点触发;根据所述视频的一个或多个播放内容触发。5.根据权利要求1至4中任一项所述的方法,其中,确定所述视频帧中所包含的视觉对象的步骤包括:对所述视频帧进行目标提取,结合所述视频的视频相关信息,以确定所述视频帧中所包含的视觉对象。6.根据权利要求1至5中任一项所述的方法,其中,确定所述一个或多个视频帧所对应的场景信息的步骤包括:确定每个所述视觉对象所对应的对象特征;根据每个所述视觉对象所对应的对象特征间的关联性信息,确定所述一个或多个视频帧所对应的场景信息。7.根据权利要求6所述的方法,其中,确定每个所述视觉对象所对应的对象特征的步骤包括:根据每个所述视觉对象的对象属性,确定每个所述视觉对象所对应的对象特征。8.根据权利要求1至7中任一项所述的方法,其中,确定所述视频的视频帧所对应的视频语义信息的步骤包括:对所述视觉对象以及所述视觉对象所对应的对象特征进行语义组合,以生成候选视频语义信息;根据所述场景信息,结合所述候选视频语义信息,确定所述视频的视频帧所对应的视频语义信息。9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括:获取与所述一个或多个视频帧相对应的语音和/或字幕信息;其中,确定所述视频的视频帧所对应的视频语义信息的步骤包括:根据所述场景信息,结合所述语音和/或字幕信息,确定所述视频的视频帧所对应的视频语义信息。10.根据权利要求1至9中任一项所述的方法,其中,该方法还包括:获取一个或多个视频检索序列;将所述视频检索序列与所述视频语义信息进行匹配,以确定所述视频检索序列所对应的目标视频。11.一种用于获取视频语义信息的处理设备,其中,所述处理设备包括:用于提取视频中的一个或多个视频帧的装置;用于对所述视...
【专利技术属性】
技术研发人员:罗江春,陈锡岩,
申请(专利权)人:北京一览科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。