图文一致性检测模型的训练和使用方法、装置和设备制造方法及图纸

技术编号：40008794 阅读：31 留言：0更新日期：2024-01-16 14:56

本申请公开了一种图文一致性检测模型的训练和使用方法、装置、设备、介质和程序产品，属于数据检测领域，该方法包括：获取样本视频的样本封面和样本文本；获取样本封面中的n个封面图像块分别对应的图像块特征向量；以及获取样本文本对应的文本特征向量；融合图像块特征向量和文本特征向量，得到融合特征；对融合特征进行分类，得到预测的分类结果；以减小预测的分类结果与真实分类结果之间的误差为目标，对图文一致性检测模型进行训练。该方法可以提取样本封面中的图像块特征向量，从而对相似封面进行有效区分，提升判断样本封面与样本文本是否图文一致的正确率。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及数据检测领域，特别涉及一种图文一致性检测模型的训练和使用方法、装置、设备、介质和程序产品。

技术介绍

1、在搜索视频的时候，存在想要搜索的内容(输入的文本内容，包括标题或摘要)与搜索出的视频不匹配的问题，通常表现为视频的封面与标题出现图文不一致的情况，例如封面表示的内容是a游戏，标题表示的内容是b游戏。

2、相关技术中，通过使用相关图文一致性检测模型，将封面对应的特征与标题对应的特征融合，根据获得的融合特征判断封面与标题是否图文一致。

3、然而，这种技术获得的融合特征过于粗糙，会将相似但不相同的多种图片特征判断为同一种特征，从而得出封面与标题具备图文一致的错误结果。

技术实现思路

1、本申请提供了一种图文一致性检测模型的训练和使用方法、装置、设备、介质和程序产品，该技术方案至少包括：

2、根据本申请实施例的一个方面，提供了一种图文一致性检测模型的训练方法，该方法包括：

3、获取样本视频的样本封面和样本文本，样本文本包括视频标题...

【技术保护点】

1.一种图文一致性检测模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取所述样本封面中的n个封面图像块分别对应的图像块特征向量，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过图像块抽取模型从所述样本封面中抽取出所述n个封面图像块，包括：

4.根据权利要求1至3任一所述的方法，其特征在于，所述融合所述图像块特征向量和所述文本特征向量，得到融合特征，包括：

5.根据权利要求4所述的方法，其特征在于，所述融合所述n个封面图像块中的第i个封面图像块对应的图像块特征向量与所述文本特征向量，得到第...

【技术特征摘要】

1.一种图文一致性检测模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取所述样本封面中的n个封面图像块分别对应的图像块特征向量，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过图像块抽取模型从所述样本封面中抽取出所述n个封面图像块，包括：

4.根据权利要求1至3任一所述的方法，其特征在于，所述融合所述图像块特征向量和所述文本特征向量，得到融合特征，包括：

5.根据权利要求4所述的方法，其特征在于，所述融合所述n个封面图像块中的第i个封面图像块对应的图像块特征向量与所述文本特征向量，得到第i个融合特征，包括：

6.根据权利要求5所述的方法，其特征在于，所述采用双线性交互方式，融合所述n个封面图像块中的第i个封面图像块对应的图像块特征向量与所述文本特征向量，得到所述第i个融合特征，包括：

7.根据权利要求1至6任一所述的方法，其特征在于，所述图文一致性检测模型包括分类层，所述对所述融合特征进行分类，得到预测的分类结果，包括：

8.根据权利要求1至7任一所述的方法，其特征在于，所述图文一致性检测模型包括编码模型，所述获取所述样本文本对应的文本特征向量，包括：

9.根据权利要求8所述的方法，其特征在于，所述文本特征向量包括单词向量和句子向量；

10.一种图文一致性检测模型的使用方法，其特征在于，所述方法包括：

11.根据权利要求10所述的方法，其特征在于，所述获...

【专利技术属性】
技术研发人员：黄剑辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人