一种视频摘要生成方法和装置制造方法及图纸

技术编号：35213199 阅读：21 留言：0更新日期：2022-10-15 10:27

本申请公开了一种视频摘要生成方法和装置，其中方法包括：基于用户的行为数据，采用自注意力计算方式，生成所述用户的注意力编码参数；基于所述用户的注意力编码参数，确定目标视频的每个片段是否为所述用户的兴趣片段，并从所述兴趣片段中提取出兴趣帧；采用注意力计算方式，对所述兴趣帧进行融合处理，得到所述目标视频的视频摘要。采用本申请，可以提高视频摘要的生成效率，降低应用成本，并且有利于提高视频观看率。提高视频观看率。提高视频观看率。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频摘要生成方法和装置

[0001]本专利技术涉及计算机视觉技术，特别是涉及一种视频摘要生成方法和装置。

技术介绍

[0002]目前，很多视频平台为用户提供了视频相关的多种服务。例如，视频观看服务、视频上传服务和付费视频服务等。
[0003]面对大量的视频数据和冗长的视频内容，为了提高视频观看率，视频制作方和视频平台通常会对视频进行剪辑，从视频中提取出部分帧合成新的视频(即视频摘要)，以帮助用户快速浏览和理解内容。
[0004]专利技术人在实现本专利技术的过程中发现：现有的视频摘要生成方案存在效率低、成本高、提升视频观看率的效果差等问题。具体原因分析如下：
[0005]现有的视频摘要生成方案中，视频剪辑主要还是依靠人工浏览视频，将包含重要信息的帧组合在一起获得视频摘要，这样，需要人工浏览大量的视频，导致生成视频摘要的成本高且效率低。
[0006]另外，人工提取视频关键帧或关键片段时主要是基于预设的规则，包括屏幕变化、音频变化或匹配预定义的屏幕标签等。由于这些规则具有普适性，只能迎合大多数用户的喜好。而在实际应用中，不同用户可能具有不同的偏好，相应地，在同一个视频中不同用户喜欢的视频内容也会不同。这样，所提取的视频关键帧或关键片段并不能与每个用户的兴趣相匹配，即视频中用户感兴趣的内容可能不会呈现在视频摘要中，如此，则无法有效吸引用户选择观看该视频，从而无法有效提升视频观看率。

技术实现思路

[0007]有鉴于此，本专利技术的主要目的在于提供一种视频摘要生成方法和装置，...

【技术保护点】

【技术特征摘要】
1.一种视频摘要生成方法，其特征在于，包括：基于用户的行为数据，采用自注意力计算方式，生成所述用户的注意力编码参数；基于所述用户的注意力编码参数，确定目标视频的每个片段是否为所述用户的兴趣片段，并从所述兴趣片段中提取出兴趣帧；采用注意力计算方式，对所述兴趣帧进行融合处理，得到所述目标视频的视频摘要。2.根据权利要求1所述的方法，其特征在于，所述行为数据为所述用户在当前统计窗口内的输入相关信息和观看行为记录；所述输入相关信息包括输入的内容信息、执行输入操作的时间和/或执行输入操作的地点。3.根据权利要求1所述的方法，其特征在于，所述生成所述用户的注意力编码参数包括：对所述用户的行为数据进行编码，得到所述行为数据的向量表示；将所述向量表示输入至预设的第一自注意力计算模型进行处理，得到所述用户的注意力编码参数。4.根据权利要求1所述的方法，其特征在于，所述确定目标视频的每个片段是否为所述用户的兴趣片段，并从所述兴趣片段中提取出兴趣帧包括：对于每个所述片段，对该片段中的每个视频帧进行编码，并将编码得到的所有视频帧向量表示，输入至预设的第二自注意力计算模型进行自注意力处理，得到该片段中每个视频帧的注意力；将该片段对应的所有所述注意力与所述用户的注意力编码参数进行匹配，得到该片段与所述用户之间的匹配值，基于所述匹配值，判断该片段是否为兴趣片段，如果是，则基于所述自注意力处理过程中获得的每个所述注意力对应的帧间权重，从该片段中选择所述帧间权重大于预设兴趣阈值的帧，作为兴趣帧。5.根据权利要求1所述的方法，其特征在于，所述对所述兴趣帧进行融合处理包括：依次遍历每个所述兴趣片段C
i
，如果该兴趣片段C
i
为所述目标视频中的第一个兴趣片段，则将该兴趣片段C
i
中的所有兴...

【专利技术属性】
技术研发人员：唐兰林，俞江，葛玲玲，丁琳，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人