模型训练方法、信息生成方法、装置、设备和介质制造方法及图纸

技术编号：39038223 阅读：21 留言：0更新日期：2023-10-10 11:51

本公开的实施例公开了模型训练方法、信息生成方法、装置、设备和介质。该方法的一具体实施方式包括：获取训练图像数据集；对于每个训练图像数据，执行样本对生成步骤：确定每个剩余图像数据与训练图像数据之间的动态语境相似度；筛选出与训练图像数据之间对应动态语境相似度满足预设相似度条件的图像数据，作为目标图像数据；将目标图像数据和训练图像数据组成正样本图像数据对，将训练图像数据和每个剩余图像数据组成负样本图像数据对，得到负样本图像数据对组；对初始图像与文本语义转换模型进行模型训练，得到图像与文本语义转换模型。该实施方式与人工智能有关，利用图像与文本语义转换模型，可以精准地将图像转换成对应的文本语义信息。本语义信息。本语义信息。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、信息生成方法、装置、设备和介质

[0001]本公开的实施例涉及计算机
，具体涉及模型训练方法、信息生成方法、装置、设备和介质。

技术介绍

[0002]目前，图像与文本语义转换模型已广泛应用于计算机视觉和自然语言处理的众多下游任务中。对于图像与文本语义转换模型的训练，通常采用的方式为：通过对图像和文本语义的标注，来实现后续针对初始图像与文本语义转换模型的对比学习训练。
[0003]然而，专利技术人发现，当采用上述方式来训练模型，经常会存在如下技术问题：
[0004]现有图像与文本语义转换模型常将图像内容事件不一致的两个图像作为正样本对，导致所学习的样本特征无法区别出图像之间的图像细微差距，使得所训练的图像与文本语义转换模型进行文本语义转换不够精准。
[0005]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解，并因此，其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0007]本公开的一些实施例提出了模型训练方法、信息生成方法、装置、设备和介质，来解决以上
技术介绍
部分提到的技术问题。
[0008]第一方面，本公开的一些实施例提供了一种模型训练方法，包括：获取训练图像数据集；对于上述...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：获取训练图像数据集；对于所述训练图像数据集中的每个训练图像数据，执行样本对生成步骤：利用预先训练的动态语境相似度生成模型，确定剩余图像数据集中的每个剩余图像数据与所述训练图像数据之间的动态语境相似度，其中，所述剩余图像数据集为所述训练图像数据集中去除所述训练图像数据后的图像数据集；从所述剩余图像数据集中筛选出与所述训练图像数据之间对应动态语境相似度满足预设相似度条件的图像数据，作为目标图像数据；将所述目标图像数据和所述训练图像数据组成正样本图像数据对，以及将所述训练图像数据和剩余图像数据子集中的每个剩余图像数据组成负样本图像数据对，得到负样本图像数据对组；根据所得到的正样本图像数据对集和负样本图像数据对组集，对初始图像与文本语义转换模型进行模型训练，得到图像与文本语义转换模型。2.根据权利要求1所述的方法，其中，所述动态语境相似度生成模型包括：关联图像表征向量生成模型；以及所述利用预先训练的动态语境相似度生成模型，确定剩余图像数据集中的每个剩余图像数据与所述训练图像数据之间的动态语境相似度，包括：对所述训练图像数据和所述剩余图像数据分别进行数据向量化，得到训练图像向量和剩余图像向量；将所述训练图像向量输入至所述关联图像表征向量生成模型，以输出至少一个第一历史关联图像向量和至少一个第一未来关联图像向量；将所述剩余图像向量输入至所述关联图像表征向量生成模型，以输出至少一个第二历史关联图像向量和至少一个第二未来关联图像向量；根据所述至少一个第一历史关联图像向量、所述至少一个第一未来关联图像向量、所述至少一个第二历史关联图像向量和所述至少一个第二未来关联图像向量，生成动态语境相似度。3.根据权利要求2所述的方法，其中，所述关联图像表征向量生成模型包括：历史关联图像表征向量生成模型和未来关联图像表征向量生成模型，所述历史关联图像生成模型和所述未来关联图像生成模型之间的语义关联学习参数不同；以及所述将所述训练图像向量输入至所述关联图像表征向量生成模型，以输出至少一个第一历史关联图像向量和至少一个第一未来关联图像向量，包括：将所述训练图像向量输入至所述历史关联图像表征向量生成模型，以生成所述至少一个第一历史关联图像向量；将所述训练图像向量输入至所述未来关联图像表征向量生成模型，以生成所述至少一个第一未来关联图像向量。4.根据权利要求2所述的方法，其中，所述根据所述至少一个第一历史关联图像向量、所述至少一个第一未来关联图像向量、所述至少一个第二历史关联图像向量和所述至少一个第二未来关联图像向量，生成动态语境相似度，包括：对所述至少一个第一历史关联图像向量进行向量加权求和处理，得到第一加权求和向
量，以及对所述至少一个第二历史关联图像向量进行向量加权求和处理，得到第二加权求和向量；对所述至少一个第一未来关联图像向量进行向量加权求和处理，得到第三加权求和向量，以及对所述至少一个第二未来关联图像向量进行向量加权求和处理，得到第四加权求和向量；根据所述第一加权求和向量、所述第二加权求和向量、所述第三加权求和向量和第四加权求和向量，生成所述动态语境相似度。5.根据权利要求2所述的方法，其中，所述关联图像表征向量生成模型包括：学习后的至少一个语义关联学习参数；以及所述将所述训练图像向量输入至所述关联图像表征向量生成模型，以...

【专利技术属性】
技术研发人员：白亚龙，倪锦鸿，张炜，梅涛，
申请(专利权)人：京东科技控股股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人