视频摘要数据集构建方法、装置、介质及电子设备制造方法及图纸

技术编号：39164457 阅读：10 留言：0更新日期：2023-10-23 15:04

本公开涉及一种视频摘要数据集构建方法、装置、介质及电子设备，方法包括：获取目标视频的视频信息和预设的提示词模板；根据所述视频信息和所述提示词模板，生成提示词，其中，所述提示词用于指导预训练好的大语言模型的输出结果；将所述提示词输入至所述大语言模型中，生成回答所述提示词的输出结果，其中，所述输出结果为所述目标视频的摘要；根据多个所述目标视频所对应的输出结果，构建视频摘要数据集，从而快速且准确地构建出大规模的视频摘要数据集。数据集。数据集。

全部详细技术资料下载

【技术实现步骤摘要】
视频摘要数据集构建方法、装置、介质及电子设备

[0001]本公开涉及电子信息
，具体地，涉及一种视频摘要数据集构建方法、装置、介质及电子设备。

技术介绍

[0002]摘要又称概要或内容提要，摘要可以准确地描述出实体的主旨，这里的实体例如可以是文章和视频等等。在视频内容理解领域中，视频摘要描述是一个基础问题，视频摘要描述是指对视频内容进行概括，包括但不限于视频的主体、事件、时间、意图和重要细节等，从而得到视频的主旨。
[0003]目前，视频摘要描述主要是靠人工编写，人工编写速度慢，还需要编写人员对视频内容的领域有一定了解才能够准确地编写出视频的主旨，因此，如何快速且准确地构建出大规模的摘要数据集是目前亟待解决的问题。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面，本公开提供一种视频摘要数据集构建方法，包括：
[0006]获取目标视频的视频信息和预设的提示词模板；
[0007]根据所述视频信息和所述提示词模板，生成提示词，其中，所述提示词用于指导预训练好的大语言模型的输出结果；
[0008]将所述提示词输入至所述大语言模型中，生成回答所述提示词的输出结果，其中，所述输出结果为所述目标视频的摘要；
[0009]根据多个所述目标视频所对应的输出结...

【技术保护点】

【技术特征摘要】
1.一种视频摘要数据集构建方法，其特征在于，包括：获取目标视频的视频信息和预设的提示词模板；根据所述视频信息和所述提示词模板，生成提示词，其中，所述提示词用于指导预训练好的大语言模型的输出结果；将所述提示词输入至所述大语言模型中，生成回答所述提示词的输出结果，其中，所述输出结果为所述目标视频的摘要；根据多个所述目标视频所对应的输出结果，构建视频摘要数据集。2.根据权利要求1所述的方法，其特征在于，所述提示词模板包括目标视频模块，所述根据所述视频信息和所述提示词模板，生成提示词，包括：将所述视频信息填充至所述提示词模板中的所述目标视频模块，将填充所述视频信息后的提示词模板作为提示词。3.根据权利要求2所述的方法，其特征在于，所述提示词模板还包括参考样例模块，所述参考样例模块包括参考视频的参考视频信息和根据所述参考视频信息描述的所述参考视频的参考摘要。4.根据权利要求1所述的方法，其特征在于，所述视频信息包括第一语义信息和携带时序信息的第二语义信息。5.根据权利要求4所述的方法，其特征在于，所述第一语义信息包括视频标题信息、视频文字信息、视频语音信息、视频标签信息、视频质量信息、视频人物信息、视频关键词信息以及视频封面所对应的语义信息中的至少一者。6.根据权利要求4所述的方法，其特征在于，所述第二语义信息包括所述目标视...

【专利技术属性】
技术研发人员：杜正印，侯林凯，袁泽寰，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人