System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种训练样本的生成方法、视频定位方法、装置及介质。
技术介绍
1、视频定位模型用于在输入的视频数据中,定位出与输入的描述文本中的目标事件匹配的视频起止时间。
2、由于视频定位模型的训练过程需要大量的训练样本以及为了提高视频定位模型的泛化能力,通常采用数据增强技术,让有限的标注数据产生更多的等价数据来扩展训练样本集。
3、在实现本专利技术的过程中,发现现有技术中至少存在以下技术问题:
4、数据增强技术虽然能够扩充训练样本集,但采用数据增强技术得到的增强数据可能会存在噪声,如果直接将包含噪声的增强数据应用于模型训练,反而会降低视频定位模型的定位性能。
技术实现思路
1、本专利技术实施例提供了一种训练样本的生成方法、视频定位方法、装置及介质,以解决视频定位模型的定位性能受到增强样本数据中的噪声影响的问题,提高训练样本数据集的数据质量。
2、根据本专利技术一个实施例提供了一种训练样本的生成方法,该方法包括:
3、根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集;
4、根据所述增强样本数据集和参考视频定位模型,确定至少一个增强样本数据分别对应的预测定位数据;其中,所述参考视频定位模型是根据所述当前样本数据集训练得到的;
5、根据各所述预测定位数据,对所述增强样本数据集进行筛选得到目标样本数据集,并将所述目标样本数据集添加到所述当前样本数据集中;
7、其中,所述增强样本数据中包含增强样本视频和增强样本文本,所述预测定位数据包括预测事件时间段和/或预测分类标签。
8、根据本专利技术一个实施例提供了一种视频定位方法,该方法包括:
9、获取待检测事件数据;其中,所述待检测事件数据中包含待检测视频和待检测文本;
10、根据所述待检测事件数据和预先训练完成的目标视频定位模型,确定目标事件时间段;
11、其中,所述目标视频定位模型是根据训练样本数据集训练得到的,所述训练样本数据集是采用本专利技术任一实施例所述的训练样本的生成方法得到的。
12、根据本专利技术另一个实施例提供了一种训练样本的生成装置,该装置包括:
13、增强样本数据集确定模块,用于根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集;
14、预测定位数据确定模块,用于根据所述增强样本数据集和参考视频定位模型,确定至少一个增强样本数据分别对应的预测定位数据;其中,所述参考视频定位模型是根据所述当前样本数据集训练得到的;
15、增强样本数据集筛选模块,用于根据各所述预测定位数据,对所述增强样本数据集进行筛选得到目标样本数据集,并将所述目标样本数据集添加到所述当前样本数据集中;
16、训练样本数据集确定模块,用于返回执行根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集的步骤,直到满足预设结束条件时,将所述当前样本数据集作为训练样本数据集;
17、其中,所述增强样本数据中包含增强样本视频和增强样本文本,所述预测定位数据包括预测事件时间段和/或预测分类标签。
18、根据本专利技术另一个实施例提供了一种视频定位装置,该装置包括:
19、待检测事件数据获取模块,用于获取待检测事件数据;其中,所述待检测事件数据中包含待检测视频和待检测文本;
20、目标事件时间段确定模块,用于根据所述待检测事件数据和预先训练完成的目标视频定位模型,确定目标事件时间段;
21、其中,所述目标视频定位模型是根据训练样本数据集训练得到的,所述训练样本数据集是采用本专利技术任一实施例所述的训练样本的生成方法得到的。
22、根据本专利技术另一个实施例提供了一种电子设备,该电子设备包括:
23、至少一个处理器以及与所述至少一个处理器通信连接的存储器;
24、其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的训练样本的生成方法和/或本专利技术任一项实施例所述的视频定位方法。
25、根据本专利技术另一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的训练样本的生成方法和/或本专利技术任一项实施例所述的视频定位方法。
26、本专利技术实施例的技术方案,通过根据当前迭代过程中的当前样本数据集执行数据增强操作得到增强样本数据集,根据当前样本数据集训练得到的参考视频定位模型,确定增强样本数据集中每个增强样本数据对应的预测定位数据,根据各预测定位数据,对增强样本数据集进行筛选得到目标样本数据集,并将目标样本数据集添加到当前样本数据集中,重复上述筛选流程直到满足预设结束条件时,将当前样本数据集作为训练样本数据集,其中,增强样本数据中包含增强样本视频和增强样本文本,预测定位数据包括预测事件时间段和/或预测分类标签,解决了视频定位模型的定位性能受到增强样本数据中的噪声影响的问题,提高了训练样本数据集中增强样本数据的数据质量。
27、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种训练样本的生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据各所述预测定位数据,对所述增强样本数据集进行筛选得到目标样本数据集,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集,包括:
6.根据权利要求5所述的方法,其特征在于,所述获取所述当前样本数据集中的当前样本数据对,包括:
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
8.一种视频定位方法,其特征在于,包括:
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
10.根据权利要求8所述的方法,其特征在于,所述根据所述待检测事件
11.根据权利要求10所述的方法,其特征在于,所述目标视频定位模型中包含视频分割模块、匹配模块、筛选层和输出层;
12.一种训练样本的生成装置,其特征在于,包括:
13.一种视频定位装置,其特征在于,包括:
14.一种电子设备,其特征在于,所述电子设备包括:
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的训练样本的生成方法和/或权利要求8-11中任一项所述的视频定位方法。
...【技术特征摘要】
1.一种训练样本的生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据各所述预测定位数据,对所述增强样本数据集进行筛选得到目标样本数据集,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据当前迭代过程中的当前样本数据集执行数据增强操作,得到增强样本数据集,包括:
6.根据权利要求5所述的方法,其特征在于,所述获取所述当前样本数据集中的当前样本数据对,包括:
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
<...【专利技术属性】
技术研发人员:刘鲲,
申请(专利权)人:北京京邦达贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。