【技术实现步骤摘要】
一种利用行列式点过程的采样方法及装置
[0001]本专利技术涉及机器学习领域,具体而言,涉及一种利用行列式点过程的采样方法及装置。
技术介绍
[0002]自监督学习旨在通过使用仅基于输入功能生成的伪标签来求解辅助预测任务(或借口任务)来提取语义特征。尽管已经提出了各种任务以进行自我监督的学习,但一个直观的想法是通过从损坏的结构中恢复原始数据来学习表示。图像掩码自监督学习就是通过重建掩码过后的图像这一任务来达到特征学习的目的。这种方法首先由Denoising Autoencoder引入,并在自然语言处理的应用中取得重大进展。该方法已经成为了自然语言处理中的例行程序。受益于新的神经网络架构,例如ViT等,图像掩码自监督学习正变得越来越流行。
[0003]行列式点过程(DPP)是用来建模多样性的一种概率模型。它对集合中相似元素的排斥特性为其应用带来了新的潜力。行列式点过程已经被用于解决多个机器学习问题中数据多样性的问题,例如高维数据中的特征提取,图像处理中的纹理选择以及通过选择各种句子来构建信息摘要。与DPP类似的还有一些 ...
【技术保护点】
【技术特征摘要】
1.一种利用行列式点过程的采样方法,其特征在于,包括以下步骤:构建DPP概率模型;使用DPP概率模型将图像掩码过程建模为行列式点过程,利用行列式点过程选取多样化的图像块,其中选取的图像块尽可能多的保留原图所包含的信息。2.根据权利要求1所述的利用行列式点过程的采样方法,其特征在于,在采样过程中,DPP概率模型计算每个图像块之间的距离,并选择与所选子集不相似的图像块。3.根据权利要求1所述的利用行列式点过程的采样方法,其特征在于,当从待选集合中采样子集时,DPP概率模型同时捕获质量高和多样性强的子集,采集的子集包含更多原始图像信息的集合。4.根据权利要求1所述的利用行列式点过程的采样方法,其特征在于,DPP概率模型通过其中的kernel函数,仅通过像素值判断不同像素块之间的距离。5.根据权利要求1所述的利用行列式点过程的采样方法,其特征在于,DPP概率模型通过行列式点过程建模图像块之间同时出现的概率,选择最大化差异的图像块集合,被选择的图像块包含尽可能多的原图语义信息。6.根据权利要求1所述的利用行列式点过程的采样方法,其特征在于,由行列式点过程的定义可得,设S为待选集合,对于待选集合的任意子集A,其中选取的子集Y等于A的概率表示为:P(Y=A)
∝
det(L
A
)
ꢀꢀꢀꢀꢀ
(1)其中,L为实对称半正定矩阵,L
A
为L中下标索引为A的元素组成的子矩阵;归一化之后,其概率表示为:其中,I为单位矩阵;式(2)为行列式点过程建模子集多样性的方式;假设现选取图像块i,j作为网络输入,即A={i,j};...
【专利技术属性】
技术研发人员:徐俊德,廖祥云,王琼,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。