一种视频摘要的生成方法及装置制造方法及图纸

技术编号：20117855 阅读：125 留言：0更新日期：2019-01-16 12:04

本申请实施方式公开了一种视频摘要的生成方法及装置，其中，所述视频具备文字描述信息，所述方法包括：从所述视频中提取多个场景切换帧，并为所述场景切换帧设置场景标签，其中，相邻两个场景切换帧之间的相似度满足指定条件；从所述文字描述信息中提取所述视频对应的主题标签；根据所述场景切换帧的场景标签与所述主题标签之间的关联性，从所述多个场景切换帧中筛选出目标帧，并基于所述目标帧生成所述视频的视频摘要。本申请提供的技术方案，能够在提高效率的同时，精确地表征视频的主题。

A Method and Device for Generating Video Abstracts

The embodiment of this application discloses a method and device for generating a video summary, in which the video has text description information. The method includes: extracting multiple scene switching frames from the video and setting scene labels for the scene switching frames, in which the similarity between two adjacent scene switching frames satisfies specified conditions; and extracting from the text description information. According to the correlation between the scene label of the scene switching frame and the theme label, the target frame is selected from the multiple scene switching frames, and the video summary of the video is generated based on the target frame. The technical scheme provided in this application can accurately represent the theme of video while improving efficiency.

全部详细技术资料下载

【技术实现步骤摘要】
一种视频摘要的生成方法及装置
本申请涉及互联网
，特别涉及一种视频摘要的生成方法及装置。
技术介绍
当前，为了让用户在短时间内获知视频的内容，视频播放平台通常会为上传的视频制作对应的视频摘要。所述视频摘要可以是一个时长较短的视频，在所述视频摘要中可以包含原视频中的一部分场景。这样，用户在观看所述视频摘要时，可以快速地了解原视频的大概内容。目前，在制作视频摘要时，一方面可以通过人工剪辑的方式，先由视频播放平台的工作人员观看整个视频，然后将其中比较关键的片段剪辑出来，构成该视频的视频摘要。通过这种方式制作的视频摘要能够比较准确地表征视频中包含的信息，但是随着视频数量的快速增长，这种制作视频摘要的方式会耗费相当多的人力，而且制作视频摘要的速度也相当慢。鉴于此，为了节省人力并提高视频摘要的制作效率，当前通常是通过图像识别的技术来制作视频摘要。具体地，可以按照固定的时间间隔对上传的视频进行采样，从而提取出视频中的多帧图像。然后可以依次计算相邻两帧图像之间的相似度，并且可以保留相似度较低的两帧图像，从而保证保留下来的图像帧能够展示多个场景的内容。这样，可以将最终保留的图...

【技术保护点】
1.一种视频摘要的生成方法，其特征在于，所述视频具备文字描述信息，所述方法包括：从所述视频中提取多个场景切换帧，并为所述场景切换帧设置场景标签，其中，相邻两个场景切换帧之间的相似度满足指定条件；从所述文字描述信息中提取所述视频对应的主题标签；根据所述场景切换帧的场景标签与所述主题标签之间的关联性，从所述多个场景切换帧中筛选出目标帧，并基于所述目标帧生成所述视频的视频摘要。

【技术特征摘要】
1.一种视频摘要的生成方法，其特征在于，所述视频具备文字描述信息，所述方法包括：从所述视频中提取多个场景切换帧，并为所述场景切换帧设置场景标签，其中，相邻两个场景切换帧之间的相似度满足指定条件；从所述文字描述信息中提取所述视频对应的主题标签；根据所述场景切换帧的场景标签与所述主题标签之间的关联性，从所述多个场景切换帧中筛选出目标帧，并基于所述目标帧生成所述视频的视频摘要。2.根据权利要求1所述的方法，其特征在于，从所述视频中提取多个场景切换帧包括：在所述视频中确定基准帧，并依次计算所述基准帧之后的帧与所述基准帧之间的相似度；当所述基准帧与当前帧之间的相似度小于或者等于指定阈值时，将所述当前帧确定为一个场景切换帧；将所述当前帧作为新的基准帧，并依次计算所述新的基准帧之后的帧与所述新的基准帧之间的相似度，以根据计算的的所述相似度确定下一个场景切换帧。3.根据权利要求2所述的方法，其特征在于，相邻两个场景切换帧之间的相似度满足指定条件包括：相邻两个场景切换帧之间的相似度小于或者等于所述指定阈值。4.根据权利要求2所述的方法，其特征在于，计算所述基准帧之后的帧与所述基准帧之间的相似度包括：分别提取所述基准帧和当前帧的第一特征向量和第二特征向量，其中，所述第一特征向量和所述第二特征向量分别表示所述基准帧和所述当前帧的尺度不变特征；计算所述第一特征向量和所述第二特征向量之间的空间距离，并将所述空间距离的倒数作为所述基准帧与所述当前帧之间的相似度。5.根据权利要求1所述的方法，其特征在于，为所述场景切换帧设置场景标签包括：提取所述场景切换帧的特征，所述特征包括颜色特征、纹理特征以及形状特征中的至少一种；将提取的所述特征与特征样本库中的特征样本进行比对，其中，所述特征样本库中的所述特征样本与文字标签相关联；确定所述特征样本库中与提取的所述特征最相似的目标特征样本，并将所述目标特征样本关联的文字标签作为所述场景切换帧对应的场景标签。6.根据权利要求1所述的方法，其特征在于，所述文字描述信息包括所述视频的标题和/或简介；相应地，从所述文字描述信息中提取所述视频对应的主题标签包括：将所述文字描述信息与文字标签库中的文字标签进行匹配，并将匹配得到的文字标签作为所述视频的主题标签。7.根据权利要求6所述的方法，其特征在于，所述文字标签库中的文字标签与统计次数相关联，所述统计次数用于表征所述文字标签作为主题标签的总次数；相应地，当匹配得到的文字标签的数量为至少两个时，所述方法还包括：按照统计次数从大到小的顺序对匹配得到的文字标签进行排序，并将排序结果中靠前的指定数量个文字标签作为所述视频的主题标签。8.根据权利要求1所述的方法，其特征在于，从所述多个场景切换帧中筛选出目标帧包括：计算所述场景切换帧的场景标签与所述主题标签之间的相似度，并将计算的所述相似度大于指定相似度阈值的场景切换帧确定为所述目标帧。9.根据权利要求8所述的方法，其特征在于，在计算所述场景切换帧的场景标签与所述主题标签之间的相似度之后，所述方法还包括：根据计算得到的所述相似度，为对应的场景切换帧设置权重系数；识别所述场景切换帧中包含的目标对象，并根据识别出的所述目标对象与所述主题标签之间的关联性，为所述场景切换帧设置关联值；计算所述场景切换帧的权重系数与关联值的乘积，并将所述乘积大于指定乘积阈值的场景切换帧确定为所述目标帧。10.根据权利要求9所述的方法，其特征在于，所述主题标签与至少一个对象相关联；相应地，为所述场景切换帧设置关联值包括...

【专利技术属性】
技术研发人员：葛雷鸣，
申请(专利权)人：合一网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人