基于对偶注意力的视频关系预测方法、装置、设备和介质制造方法及图纸

技术编号：37982369 阅读：7 留言：0更新日期：2023-06-30 09:57

本发明专利技术属于视频处理技术领域，特别是涉及一种基于对偶注意力的视频关系预测方法、装置、设备和介质，其中，方法包括：获取待预测的视频；对视频进行预处理，得到预处理视频；基于对偶注意力机制对预处理视频中的目标对象进行预测，输出目标对象的动作谓词预测结果和位置谓词预测结果；将动作谓词预测结果和位置谓词预测结果进行组合，及根据预设的权重调节参数进行优化，得到优化的预测结果。本发明专利技术通过对视频进行分析预测，精准预测视频中的目标对象的动作谓词和位置谓词，并将动作谓词和位置谓词进行组合及优化，进而获取高置信度且符合语法表达形式的预测结果，实现了对视频中目标对象的动作和位置关系预测技术的优化。对象的动作和位置关系预测技术的优化。对象的动作和位置关系预测技术的优化。

全部详细技术资料下载

【技术实现步骤摘要】
基于对偶注意力的视频关系预测方法、装置、设备和介质

[0001]本专利技术涉及视频处理
，特别涉及一种基于对偶注意力的视频关系预测方法、装置、设备和介质。

技术介绍

[0002]如今静态图像上的视觉关系检测已经得到了广泛的研究，但相比静态图像，视频中的关系检测要更加复杂多变。视觉关系检测问题最初主要解决对于关系的巨大标签空间建模问题。一些研究还尝试了修剪不太可能的关系候选来提高效率，或者改善训练对象来提升效率，目前现有技术对于视频的视觉关系研究遵循三阶段检测框架，即检测物体轨迹、物体关系预测、贪婪关系关联三个阶段。然而，目前的研究仅在于如何更好的提取目标对象的特征或识别目标对象的轨迹，忽略了关系组件(如谓词)的预测结果对关系预测结果的影响。
[0003]因此，如何精准预测视频中目标对象的动作谓词和位置谓词，并根据动作谓词和位置谓词预测目标对象的动作和位置之间的关系，以获取高置信度且符合语法表达形式的关系预测结果是目前需要解决的问题。

技术实现思路

[0004]本专利技术提供一种基于对偶注意力的视频关系预测方法、装置、设备和介质，旨在精准预测视频中目标对象的动作谓词和位置谓词，并根据动作谓词和位置谓词预测目标对象的动作和位置之间的关系，以获取高置信度且符合语法表达形式的关系预测结果，实现了对关系预测技术的优化。
[0005]为了实现上述专利技术目的，本专利技术第一方面提出一种基于对偶注意力的视频关系预测方法，所述方法包括：
[0006]获取待预测的视频；
[0007...

【技术保护点】

【技术特征摘要】
1.一种基于对偶注意力的视频关系预测方法，其特征在于，所述方法包括：获取待预测的视频；对所述视频进行预处理，得到预处理视频；基于对偶注意力机制对所述预处理视频中的目标对象进行预测，输出所述目标对象的动作谓词预测结果和位置谓词预测结果；将所述动作谓词预测结果和所述位置谓词预测结果进行组合，得到初始预测结果；根据预设的权重调节参数对所述初始预测结果进行优化，得到优化的预测结果。2.根据权利要求1所述的基于对偶注意力的视频关系预测方法，其特征在于，所述对所述视频进行预处理，得到预处理视频，包括：对所述视频进行去隔行处理，得到第一视频；对所述第一视频进行图像重采样处理，得到第二视频；对所述第二视频进行降噪处理，得到预处理视频。3.根据权利要求1所述的基于对偶注意力的视频关系预测方法，其特征在于，对偶注意力机制包括编码组件和解码组件，所述基于对偶注意力机制对所述预处理视频中的目标对象进行预测，输出所述目标对象的动作谓词预测结果和位置谓词预测结果，包括：将所述预处理视频分解为一组重叠的片段，并在每个所述片段上生成目标对象的轨迹建议；对所述轨迹建议进行特征提取，得到所述目标对象的特征数据，其中，所述特征数据包括轨迹特征、运动特征、视觉特征；根据所述轨迹特征、所述运动特征以及所述视觉特征进行关系建模，得到关系特征；采用关联规则算法结合所述关系特征将所述轨迹特征、所述运动特征、所述视觉特征进行合并，输出所述目标对象的动作谓词预测结果和位置谓词预测结果。4.根据权利要求1所述的基于对偶注意力的视频关系预测方法，其特征在于，所述将所述动作谓词预测结果和所述位置谓词预测结果进行组合，得到初始预测结果，包括：基于字符串拼接将所述动作谓词预测结果和所述位置谓词预测结果进行组合，得到初始预测结果。5.根据权利要求1所述的基于对偶注意力的视频关系预测方法，其特征在于，所述根据预设的权重调节参数对所述初始预测结果进行优化，得到优化的预测结果，包括：读取预设的权重调节参数，其中，所述权重调节参数包括动作谓词调节参数和位置谓词调节参数；根据所述动作谓词调节参数和所述位置谓词调节参数对所述初始预测结果进行加权...

【专利技术属性】
技术研发人员：狄东林，赵晨旭，茹彬鑫，曹峰，季聪，
申请(专利权)人：北京识渊科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人