类别比例引导的无监督领域适应建模方法、系统、设备及介质技术方案

技术编号:34447031 阅读:67 留言:0更新日期:2022-08-06 16:43
本申请公开了一种类别比例引导的无监督领域适应建模方法、系统、设备及介质,包括:数据准备与初始化:收集训练数据集,所述训练数据集至少包括一训练样本训练源域分类:将源域样本进行随机傅里叶特征变换,得到源域映射样本矩阵训练目标域分类:将目标域样本进行傅里叶特征变换,其中傅里叶特征变换的参数与随机种子与源域中的RFF保持一致,得到目标域映射样本矩阵H

【技术实现步骤摘要】
类别比例引导的无监督领域适应建模方法、系统、设备及介质


[0001]本申请涉及适应建模
,尤其涉及一种类别比例引导的无监督领域适应建模方法、系统、设备及介质。

技术介绍

[0002]机器学习可以用于解决复杂未知模型的建模问题,在很多领域得到了广泛的应用。由于建模是数据驱动的,因此模型准确度与数据质量紧密相关。现实中往往无法获得所有的数据,所以训练数据和真实场景产生的数据具有较大的概率分布偏差,容易导致模型精度下降甚至失效的问题。例如,在地球物理测井解释中,新井的测井数据与已解释井的测井数据分布偏差较大,为机器学习在测井解释模型建立的应用带来了较大的挑战。对于分布差异问题,可以采用领域适应方法来解决,对于目标域没有任何标签的场景,则限定到无监督领域适应。领域适应方法主要包括:基于样本加权、基于分布对齐和基于模型调整的领域适应方法。其中样本加权主要用于较小的分布偏差场景;分布对齐依赖于目标域伪标签的质量,而且多数针对的是边缘分布和条件分布差异的场景;模型调整具有最广阔的使用度,但是往往需要目标域存在一定的标签,难以胜任目标域无标签的场景。综上,已有的技术不适用先验分布差异的场景。

技术实现思路

[0003]本申请的主要目的在于提供一种类别比例引导的无监督领域适应建模方法、装置、设备及介质,旨在解决分类任务中源域和目标域的边缘分布和先验分布均发生变化的领域适应技术问题。
[0004]为实现上述目的,本申请提供一种类别比例引导的无监督领域适应建模方法,包括以下步骤:
[0005]数据准备与初始化:收集训练数据集,所述训练数据集至少包括一训练样本
[0006]训练源域分类:将源域样本进行随机傅里叶特征变换,得到源域映射样本矩阵
[0007]训练目标域分类:将目标域样本进行傅里叶特征变换,其中傅里叶特征变换的参数与随机种子与源域中的RFF保持一致,得到目标域映射样本矩阵H
t
,目标域分类器描述为f
t
(x)=φ(x)B
t
,进而得到最优的源域输出权重矩阵
[0008]输出目标域分类:输出得到目标域分类器。
[0009]优选的,所述训练样本中:d为样本的初始特征维度,样本对应的标签为中:d为样本的初始特征维度,样本对应的标签为表示实数域,标签采用独热编码;
[0010]设收集的源域样本有n
s
个,且每个样本均有标签,则源域样例集合为
为源域第i个样本,为对应的标签;目标域样本有n
t
,但是没有任何标签,目标域样本集合为标签,目标域样本集合为为目标域的第i个样本;
[0011]人工设定训练平衡系数γ1,η1,η2>0,人工设定比例矩阵Ξ=diag(p),为目标域类别比例向量。
[0012]优选的,所述源域映射样本矩阵k为映射后样本维度,源域分类器描述为f
s
(x)=φ(x)B
S
,为映射函数,为再生核希尔伯特空间,通过求解以下优化问题求解即:
[0013][0014]其中,
[0015]优选的,所述源域和目标域的特征变换方式完全一致,目标域分类器f
t
(x)=φ(x)B
t
中通过求解以下优化问题求解即:
[0016][0017]其中,L为根据得到的图拉普拉斯矩阵。
[0018]优选的,所述目标域分类器f
t
(x)=φ(x)B
t
采用梯度下降法进行训练,即:
[0019][0020]其中,δ表示学习率,表示第r步学习得到的B
t
,表示第r+1步学习得到的B
t
,且
[0021][0022]本申请还涉及一种类别比例引导的无监督领域适应建模系统,包括:
[0023]数据准备与初始化模块:用于收集训练数据集,所述训练数据集至少包括一个训练样本
[0024]训练源域分类器,将源域样本进行随机傅里叶特征变换,得到源域映射样本矩阵
[0025]训练目标域分类器:将目标域样本进行傅里叶特征变换,得到目标域映射样本矩阵H
t
,目标域分类器描述为f
t
(x)=φ(x)B
t

[0026]输出目标域分类器:输出得到目标域分类器。
[0027]本申请还涉及一种类别比例引导的无监督领域适应建模设备,所述电子设备包括:
[0028]至少一个处理器;以及,
[0029]与所述至少一个处理器通信连接的存储器;其中,
[0030]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的一种类别比例引导的无监督领域适应建模方法的步骤。
[0031]本申请还涉及一种计算机可读存储介质,所述计算机可读存储介质上存储有实现类别比例引导的无监督领域适应建模方法的程序,所述实现类别比例引导的无监督领域适应建模方法的程序被处理器执行以实现上述类别比例引导的无监督领域适应建模方法的步骤。
[0032]本申请相对于现有技术,能够有效应对分类任务中源域和目标域的边缘分布和先验分布均发生变化的领域适应技术问题,同时具有非线性拟合能力强、训练速度快、模型准确度高的优点。
附图说明
[0033]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0034]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0035]图1为本申请类别比例引导的无监督领域适应建模方法流程示意图。
[0036]本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0037]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本专利技术保护的范围。
[0038]实施例1
[0039]本申请实施例提供一种类别比例引导的无监督领域适应建模方法,参照图1,包括:
[0040]步骤一、数据准备与初始化
[0041]收集训练数据集,所述训练数据集至少包括一训练样本,样本d为样本的初始特征维度,样本对应的标签为的初始特征维度,样本对应的标签为表示实数域,标签采用独热编码,c为类别总数;
[0042]设收集的源域样本有n
s
个,且每个样本均有标签,则源域样例集合为个,且每个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种类别比例引导的无监督领域适应建模方法,其特征在于,包括以下步骤:数据准备与初始化:收集训练数据集,所述训练数据集至少包括一训练样本训练源域分类:将源域样本进行随机傅里叶特征变换,得到源域映射样本矩阵训练目标域分类:将目标域样本进行傅里叶特征变换,其中傅里叶特征变换的参数与随机种子与源域中的RFF保持一致,得到目标域映射样本矩阵H
t
,目标域分类器描述为f
t
(x)=φ(X)B
t
,进而得到最优的源域输出权重矩阵输出目标域分类:输出得到目标域分类器。2.如权利要求1所述一种类别比例引导的无监督领域适应建模方法,其特征在于,所述训练样本中:d为样本的初始特征维度,样本对应的标签为中:d为样本的初始特征维度,样本对应的标签为表示实数域,标签采用独热编码;设收集的源域样本有n
s
个,且每个样本均有标签,则源域样例集合为个,且每个样本均有标签,则源域样例集合为为源域第i个样本,为对应的标签;目标域样本有n
t
,但是没有任何标签,目标域样本集合为集合为为目标域的第i个样本;人工设定训练平衡系数γ1,η1,η2>0,人工设定比例矩阵>0,人工设定比例矩阵为目标域类别比例向量。3.如权利要求1所述一种类别比例引导的无监督领域适应建模方法,其特征在于,所述源域映射样本矩阵k为映射后样本维度,源域分类器描述为f
s
(x)=φ(x)B
s
,为映射函数,为再生核希尔伯特空间,通过求解以下优化问题求解即:其中,4.如权利要求1所述类别比例引导的无监督领域适应建模方法,其特征在于,所述源域和目标域的特征变换方式完全一致...

【专利技术属性】
技术研发人员:吕文君康宇
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1