一种指令数据集构建方法、装置、设备及介质制造方法及图纸

技术编号：43012728 阅读：34 留言：0更新日期：2024-10-18 17:18

本申请涉及数据处理技术领域，尤其涉及一种指令数据集构建方法、装置、设备及介质，在本申请实施例中，通过多模态大模型确定视频中每个目标对应的样本运动描述，更好的对交通领域的视频内容进行了提取，使得最终构建的数据中即包含细节信息也包含时序信息，能够更好的对大模型进行训练。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，尤其涉及一种指令数据集构建方法、装置、设备及介质。

技术介绍

1、随着技术的发展，多模态大模型被广泛应用于各个领域，其中，指令数据集构造的优劣程度严重影响多模态大模型的能力。针对视频的指令数据集，从视频的整体描述其内容，往往不能很好的保持细节。在任务设定方面，也没有针对性的设计提升细节和时序信息获取的任务。

2、针对交通领域的视频-文本指令数据集的构建，往往视频中每帧图像的详细内容并不能涵盖视频所要表达的重点(比如动态信息)。然而针对整段视频的整体描述又缺少细节。尤其是在垂域应用上，在领域数据构建方面，往往需要重点分析的方向，现有的指令数据集构建方法并不能同时兼顾细节和时序。

技术实现思路

1、本申请提供了一种指令数据集构建方法、装置、设备及介质，用以解决现有技术中指令数据集构建方法并不能同时兼顾细节和时序的问题。

2、第一方面，本申请实施例提供了一种指令数据集构建方法，所述方法包括：

3、对样本视频中的每帧图像进行目标识别，确定每帧...

【技术保护点】

1.一种指令数据集构建方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述第二提示词中还携带有删除冗余信息的子提示词。

4.根据权利要求2所述的方法，其特征在于，所述大模型为语言大模型或多模态大模型。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述识别该图像中的目标感兴趣区域包括：

7.根据权利要求6所述的方法，其特征在于，所述小模型为目标检测模型。</p>

8.一种...

【技术特征摘要】

1.一种指令数据集构建方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述第二提示词中还携带有删除冗余信息的子提示词。

4.根据权利要求2所述的方法，其特征在于，所述大模型为语言大模型或多模态大模型。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述识别该图像中的目标感兴趣区域包括：...

【专利技术属性】
技术研发人员：刘微，刘晓潇，鞠全永，郑维学，赵宇奔，李广琴，
申请(专利权)人：海信集团控股股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人