图文一致性检测模型的训练和使用方法、装置和设备制造方法及图纸

技术编号:40008794 阅读:31 留言:0更新日期:2024-01-16 14:56
本申请公开了一种图文一致性检测模型的训练和使用方法、装置、设备、介质和程序产品,属于数据检测领域,该方法包括:获取样本视频的样本封面和样本文本;获取样本封面中的n个封面图像块分别对应的图像块特征向量;以及获取样本文本对应的文本特征向量;融合图像块特征向量和文本特征向量,得到融合特征;对融合特征进行分类,得到预测的分类结果;以减小预测的分类结果与真实分类结果之间的误差为目标,对图文一致性检测模型进行训练。该方法可以提取样本封面中的图像块特征向量,从而对相似封面进行有效区分,提升判断样本封面与样本文本是否图文一致的正确率。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。

【技术实现步骤摘要】

本申请实施例涉及数据检测领域,特别涉及一种图文一致性检测模型的训练和使用方法、装置、设备、介质和程序产品。


技术介绍

1、在搜索视频的时候,存在想要搜索的内容(输入的文本内容,包括标题或摘要)与搜索出的视频不匹配的问题,通常表现为视频的封面与标题出现图文不一致的情况,例如封面表示的内容是a游戏,标题表示的内容是b游戏。

2、相关技术中,通过使用相关图文一致性检测模型,将封面对应的特征与标题对应的特征融合,根据获得的融合特征判断封面与标题是否图文一致。

3、然而,这种技术获得的融合特征过于粗糙,会将相似但不相同的多种图片特征判断为同一种特征,从而得出封面与标题具备图文一致的错误结果。


技术实现思路

1、本申请提供了一种图文一致性检测模型的训练和使用方法、装置、设备、介质和程序产品,该技术方案至少包括:

2、根据本申请实施例的一个方面,提供了一种图文一致性检测模型的训练方法,该方法包括:

3、获取样本视频的样本封面和样本文本,样本文本包括视频标题和视频摘要中的至少一本文档来自技高网...

【技术保护点】

1.一种图文一致性检测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述样本封面中的n个封面图像块分别对应的图像块特征向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过图像块抽取模型从所述样本封面中抽取出所述n个封面图像块,包括:

4.根据权利要求1至3任一所述的方法,其特征在于,所述融合所述图像块特征向量和所述文本特征向量,得到融合特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述融合所述n个封面图像块中的第i个封面图像块对应的图像块特征向量与所述文本特征向量,得到第...

【技术特征摘要】

1.一种图文一致性检测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述样本封面中的n个封面图像块分别对应的图像块特征向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过图像块抽取模型从所述样本封面中抽取出所述n个封面图像块,包括:

4.根据权利要求1至3任一所述的方法,其特征在于,所述融合所述图像块特征向量和所述文本特征向量,得到融合特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述融合所述n个封面图像块中的第i个封面图像块对应的图像块特征向量与所述文本特征向量,得到第i个融合特征,包括:

6.根据权利要求5所述的方法,其特征在于,所述采用双线性交互方式,融合所述n个封面图像块中的第i个封面图像块对应的图像块特征向量与所述文本特征向量,得到所述第i个融合特征,包括:

7.根据权利要求1至6任一所述的方法,其特征在于,所述图文一致性检测模型包括分类层,所述对所述融合特征进行分类,得到预测的分类结果,包括:

8.根据权利要求1至7任一所述的方法,其特征在于,所述图文一致性检测模型包括编码模型,所述获取所述样本文本对应的文本特征向量,包括:

9.根据权利要求8所述的方法,其特征在于,所述文本特征向量包括单词向量和句子向量;

10.一种图文一致性检测模型的使用方法,其特征在于,所述方法包括:

11.根据权利要求10所述的方法,其特征在于,所述获...

【专利技术属性】
技术研发人员:黄剑辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1