【技术实现步骤摘要】
检索模型的训练和识别方法、电子设备及存储介质
[0001]本申请涉及机器学习
,特别是涉及一种检索模型的训练和识别方法、二值转换模型的训练方法、电子设备及存储介质。
技术介绍
[0002]跨模态检索是一项极具挑战性的任务,它要求检索模型能够连接不同模态数据之间所存在的巨大语义鸿沟。在检索模型支持图像、文本两种模态的前提下,对跨检索模型的检索(检索与图像匹配的文本)过程进行举例说明。检索模型可以提取图像的特征,然后对该提取得到的特征与数据库中文本特征的相似度进行一一计算,并找到符合相似度条件的文本特征对应的文本作为与该图像匹配的文本。
[0003]一般来说,为了实现检索的目的,在使用检索模型进行检索之前,需要对其进行训练,以提高后续检索模型的检索能力。但是,现有的训练方法得到的检索模型的检索能力依然受限。
技术实现思路
[0004]本申请提供一种检索模型的训练和识别方法、二值转换模型的训练方法、电子设备及存储介质,能够解决现有训练方法得到的检索模型的检索能力受限的问题。
[0005]为解决上述技术问题,本申请采用的一个技术方案是:提供一种检索模型的训练方法,该方法包括:获取第一样本集,其中,第一样本集中包括多个第一样本,每个第一样本包括一对第一样本对象和第二样本对象,第一样本对象和第二样本对象的模态不同;利用检索模型提取第一样本对象的第一特征和第二样本对象的第一特征,第一特征属于第一语义空间;利用检索模型将第一特征映射成第二特征,第二特征属于第二语义空间,第二语义空间为生成模型的编
【技术保护点】
【技术特征摘要】
1.一种检索模型的训练方法,其特征在于,包括:获取第一样本集,其中,所述第一样本集中包括多个第一样本,每个所述第一样本包括一对第一样本对象和第二样本对象,所述第一样本对象和所述第二样本对象的模态不同;利用所述检索模型提取所述第一样本对象的第一特征和所述第二样本对象的第一特征,所述第一特征属于第一语义空间;利用所述检索模型将所述第一特征映射成第二特征,所述第二特征属于第二语义空间,所述第二语义空间为所述生成模型的编码器提取的特征所属语义空间;利用生成模型的解码器生成所述第一样本对象的第二特征对应的第一生成对象、所述第二样本对象的第二特征对应的第二生成对象,所述第一生成对象和所述第二样本对象的模态相同,所述第二生成对象和所述第一样本对象的模态相同;利用鉴别器对所述第一生成对象和所述第二生成对象进行鉴别,基于鉴别结果调整所述检索模型的参数。2.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:利用所述生成模型的编码器提取所述第一样本对象的第三特征和所述第二样本对象的第三特征;基于所述第二特征和第三特征之间的差异,调整所述检索模型的参数。3.根据权利要求1所述的方法,其特征在于,在利用鉴别器对所述第一生成对象和所述第二生成对象进行鉴别之前,包括:对所述鉴别器进行训练。4.根据权利要求3所述的方法,其特征在于,所述对所述鉴别器进行训练,包括:利用所述生成模型的编码器得到所述第一样本对象的第四特征和所述第二样本对象的第四特征,并利用所述检索模型得到所述第一样本对象的第五特征和所述第二样本对象的第五特征,所述第四特征和第五特征属于第二语义空间,所述第五特征的得到方式与所述第二特征的得到方式相同;利用所述生成模型的解码器生成所述第一样本对象的第四特征对应的第三生成对象和所述第二样本对象的第四特征对应的第四生成对象,并利用所述生成模型的编码器生成所述第一样本对象的第五特征对应的第五生成对象和所述第二样本对象的第五特征对应的第六生成对象,所述第三生成对象、第五生成对象和所述第二样本对象的模态相同,所述第四生成对象、第六生成对象和所述第一样本对象的模态相同;利用所述鉴别器对所述第三生成对象和第五生成对象进行鉴别,并利用所述鉴别器对所述第四生成对象和第六生成对象进行鉴别,基于鉴别结果调整所述鉴别器的参数。5.根据权利要求1所述的方法,其特征在于,在所述利用所述检索模型提取所述第一样本对象的第一特征和所述第二样本对象的第一特征之前,包括:对所述检索模型进行预训练。6.根据权利要求5所述的方法,其特征在于,所述对所述检索模型进行预训练,包括:利用所述检索模型提取所述第一样本对象的第六特征和第二样本对象的第六特征;利用所述检索模型对所述第六特征进行分类,基于分类结果调整所述检索模型的参数。7.根据权利要求6所述的方法,其特征在于,在所述利用所述检索模型提取所述第一样
本对象的第六特征和第二样本对象的第六特征之后,还包括:基于所述第一样本间样本对象的第六特征的差异,以及基于所述第一样本内样本对象的第六特征的差异,调整所述检索模型的参数。8.根据权利要求1所述的方法,其特征在于,在所述利用生成模型的解码器生成所述第一样本对象的第二特征对应的第一生成对象、所述第二样本对象的第二特征对应的第二生成对象之前,还包括:对所述生成模型进行训练。9.根据权利要求8所述的方法,其特征在于,所述对所述生成模型进行训练,包括:利用所述生成模型生成所述第一样本对象对应的第七生成对象和所述第二样本对象对应的第八生成对象,所述第七生成对象和所述第二样本对象的模态相同,所述第八生成对象和所述第一样本对象的模态相同;利用对偶模型获取所述第一样本对象和第七生成对象的第一匹配结果、所述第二样本对象和第八生成对象的第一匹配结果,基于所述第一匹配结果调整所述生成模型的...
【专利技术属性】
技术研发人员:刘俊浩,杨敏,李成明,徐睿峰,姜青山,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。