视频摘要数据集构建方法、装置、介质及电子设备制造方法及图纸

技术编号:39164457 阅读:10 留言:0更新日期:2023-10-23 15:04
本公开涉及一种视频摘要数据集构建方法、装置、介质及电子设备,方法包括:获取目标视频的视频信息和预设的提示词模板;根据所述视频信息和所述提示词模板,生成提示词,其中,所述提示词用于指导预训练好的大语言模型的输出结果;将所述提示词输入至所述大语言模型中,生成回答所述提示词的输出结果,其中,所述输出结果为所述目标视频的摘要;根据多个所述目标视频所对应的输出结果,构建视频摘要数据集,从而快速且准确地构建出大规模的视频摘要数据集。数据集。数据集。

【技术实现步骤摘要】
视频摘要数据集构建方法、装置、介质及电子设备


[0001]本公开涉及电子信息
,具体地,涉及一种视频摘要数据集构建方法、装置、介质及电子设备。

技术介绍

[0002]摘要又称概要或内容提要,摘要可以准确地描述出实体的主旨,这里的实体例如可以是文章和视频等等。在视频内容理解领域中,视频摘要描述是一个基础问题,视频摘要描述是指对视频内容进行概括,包括但不限于视频的主体、事件、时间、意图和重要细节等,从而得到视频的主旨。
[0003]目前,视频摘要描述主要是靠人工编写,人工编写速度慢,还需要编写人员对视频内容的领域有一定了解才能够准确地编写出视频的主旨,因此,如何快速且准确地构建出大规模的摘要数据集是目前亟待解决的问题。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面,本公开提供一种视频摘要数据集构建方法,包括:
[0006]获取目标视频的视频信息和预设的提示词模板;
[0007]根据所述视频信息和所述提示词模板,生成提示词,其中,所述提示词用于指导预训练好的大语言模型的输出结果;
[0008]将所述提示词输入至所述大语言模型中,生成回答所述提示词的输出结果,其中,所述输出结果为所述目标视频的摘要;
[0009]根据多个所述目标视频所对应的输出结果,构建视频摘要数据集。
[0010]第二方面,本公开提供一种视频摘要数据集构建装置,包括:
[0011]获取模块,用于获取目标视频的视频信息和预设的提示词模板;
[0012]第一生成模块,用于根据所述视频信息和所述提示词模板,生成提示词,其中,所述提示词用于指导预训练好的大语言模型的输出结果;
[0013]第二生成模块,用于将所述提示词输入至所述大语言模型中,生成回答所述提示词的输出结果,其中,所述输出结果为所述目标视频的摘要;
[0014]构建模块,用于根据多个所述目标视频所对应的输出结果,构建视频摘要数据集。
[0015]第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面中所述方法的步骤。
[0016]第四方面,本公开提供一种电子设备,包括:
[0017]存储装置,其上存储有计算机程序;
[0018]处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面中所述
方法的步骤。
[0019]通过上述技术方案,获取目标视频的视频信息和预设的提示词模板,根据视频信息和提示词模板,生成提示词,将提示词输入至大语言模型中,生成回答提示词的输出结果,该输出结果为目标视频的摘要,利用大语言模型的特性,实现视频摘要的自动化生成,提升了视频摘要的生成速度和准确性;在此基础上,再根据多个目标视频的输出结果构建视频摘要数据集,获得目标视频的摘要,从而快速且准确地构建出大规模的视频摘要数据集。
[0020]本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0021]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
[0022]图1是根据本公开一示例性实施例示出的一种视频摘要数据集构建方法的流程图。
[0023]图2是根据本公开一示例性实施例示出的一种图像的示意图。
[0024]图3是根据本公开一示例性实施例示出的一种视频摘要数据集构建装置的框图。
[0025]图4是根据本公开一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
[0026]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0027]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0028]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0029]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0030]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0031]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0032]可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户
并获得用户的授权。
[0033]例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
[0034]作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
[0035]可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本公开的实现方式构成限定,其它满足相关法律法规的方式也可应用于本公开的实现方式中。
[0036]同时,可以理解的是,本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。
[0037]相关技术中,相对单一图片来讲,视频的内容更丰富,往往涉及到故事的发展和多个不同的场景,人工需要完整看完视频以后才可以开始对视频撰写描述,而视频往往从几分钟到几小时不等,从而编写视频摘要的速度较慢;另外,需要对视频内容的领域有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频摘要数据集构建方法,其特征在于,包括:获取目标视频的视频信息和预设的提示词模板;根据所述视频信息和所述提示词模板,生成提示词,其中,所述提示词用于指导预训练好的大语言模型的输出结果;将所述提示词输入至所述大语言模型中,生成回答所述提示词的输出结果,其中,所述输出结果为所述目标视频的摘要;根据多个所述目标视频所对应的输出结果,构建视频摘要数据集。2.根据权利要求1所述的方法,其特征在于,所述提示词模板包括目标视频模块,所述根据所述视频信息和所述提示词模板,生成提示词,包括:将所述视频信息填充至所述提示词模板中的所述目标视频模块,将填充所述视频信息后的提示词模板作为提示词。3.根据权利要求2所述的方法,其特征在于,所述提示词模板还包括参考样例模块,所述参考样例模块包括参考视频的参考视频信息和根据所述参考视频信息描述的所述参考视频的参考摘要。4.根据权利要求1所述的方法,其特征在于,所述视频信息包括第一语义信息和携带时序信息的第二语义信息。5.根据权利要求4所述的方法,其特征在于,所述第一语义信息包括视频标题信息、视频文字信息、视频语音信息、视频标签信息、视频质量信息、视频人物信息、视频关键词信息以及视频封面所对应的语义信息中的至少一者。6.根据权利要求4所述的方法,其特征在于,所述第二语义信息包括所述目标视...

【专利技术属性】
技术研发人员:杜正印侯林凯袁泽寰
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1