【技术实现步骤摘要】
本专利技术涉及计算机视觉,尤其涉及基于sinkhorn算法的零样本任务增强方法及系统。
技术介绍
1、零样本任务是一项指让机器学习模型对未知数据直接进行推理,而无须进行再训练的任务。使用大模型,如大语言模型(large language model, 简称llm)或是视觉语言模型(vision-language model, 简称vlm),直接对用户数据进行推理,而无需让大模型拟合用户数据,即是典型的零样本任务。当前包括llm与vlm在内的大模型在表征数据时存在枢纽性问题(hubness problem),即实际检索中,目标集中一些目标会被频繁地被召回。这些被多次检索的目标被称为枢纽目标,而这些枢纽目标的出现会导致大模型的总体召回率不高,这种现象被称为枢纽问题。此枢纽性问题很大程度上会影响大模型在零样本任务的性能,如使用大模型对数据进行零样本分类任务时,很对数据会被错误地分类到极个别类中,从而使分类任务准确性不高;在使用大模型进行检索任务时,大模型会让个别目标被频繁地被检索到,而大部分目标被检索到的几率为0,从而造成较低的检索召回率。本
...【技术保护点】
1.基于Sinkhorn算法的零样本任务增强方法,其特征在于,具体包括如下步骤:
2.根据权利要求1所述的基于Sinkhorn算法的零样本任务增强方法,其特征在于,当所述查询集中的查询数据数量等于1时,所述S2中,计算查询集与目标集的相似度矩阵包括:
3.根据权利要求2所述的基于Sinkhorn算法的零样本任务增强方法,其特征在于,当所述查询集中的查询数据数量等于1时,所述S4中,根据所述收敛后的吉布斯矩阵得到目标枢纽值向量,包括:
4.根据权利要求1所述的基于Sinkhorn算法的零样本任务增强方法,其特征在于,所述S3中,对所述
...【技术特征摘要】
1.基于sinkhorn算法的零样本任务增强方法,其特征在于,具体包括如下步骤:
2.根据权利要求1所述的基于sinkhorn算法的零样本任务增强方法,其特征在于,当所述查询集中的查询数据数量等于1时,所述s2中,计算查询集与目标集的相似度矩阵包括:
3.根据权利要求2所述的基于sinkhorn算法的零样本任务增强方法,其特征在于,当所述查询集中的查询数据数量等于1时,所述s4中,根据所述收敛后的吉布斯矩阵得到目标枢纽值向量,包括:
4.根据权利要求1所述的基于sinkhorn算法的零样本任务增强方法,其特征在于,所述s3中,对所述相似度矩阵进行sinkhorn归一化,计算得到收敛后的吉布斯矩阵包括:
5.根据权利要求4所述的基...
【专利技术属性】
技术研发人员:王海帅,潘正新,方辛未,池莲花,侯素娟,
申请(专利权)人:杭州心智医联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。