类别比例引导的无监督领域适应建模方法、系统、设备及介质技术方案

技术编号：34447031 阅读：67 留言：0更新日期：2022-08-06 16:43

本申请公开了一种类别比例引导的无监督领域适应建模方法、系统、设备及介质，包括：数据准备与初始化：收集训练数据集，所述训练数据集至少包括一训练样本训练源域分类：将源域样本进行随机傅里叶特征变换，得到源域映射样本矩阵训练目标域分类：将目标域样本进行傅里叶特征变换，其中傅里叶特征变换的参数与随机种子与源域中的RFF保持一致，得到目标域映射样本矩阵H

全部详细技术资料下载

【技术实现步骤摘要】
类别比例引导的无监督领域适应建模方法、系统、设备及介质

[0001]本申请涉及适应建模
，尤其涉及一种类别比例引导的无监督领域适应建模方法、系统、设备及介质。

技术介绍

[0002]机器学习可以用于解决复杂未知模型的建模问题，在很多领域得到了广泛的应用。由于建模是数据驱动的，因此模型准确度与数据质量紧密相关。现实中往往无法获得所有的数据，所以训练数据和真实场景产生的数据具有较大的概率分布偏差，容易导致模型精度下降甚至失效的问题。例如，在地球物理测井解释中，新井的测井数据与已解释井的测井数据分布偏差较大，为机器学习在测井解释模型建立的应用带来了较大的挑战。对于分布差异问题，可以采用领域适应方法来解决，对于目标域没有任何标签的场景，则限定到无监督领域适应。领域适应方法主要包括：基于样本加权、基于分布对齐和基于模型调整的领域适应方法。其中样本加权主要用于较小的分布偏差场景；分布对齐依赖于目标域伪标签的质量，而且多数针对的是边缘分布和条件分布差异的场景；模型调整具有最广阔的使用度，但是往往需要目标域存在一定的标签，难以胜任目标域无标签的场景。综上，已有的技术不适用先验分布差异的场景。

技术实现思路

[0003]本申请的主要目的在于提供一种类别比例引导的无监督领域适应建模方法、装置、设备及介质，旨在解决分类任务中源域和目标域的边缘分布和先验分布均发生变化的领域适应技术问题。
[0004]为实现上述目的，本申请提供一种类别比例引导的无监督领域适应建模方法，包括以下步骤：
[0005]数据准备...

【技术保护点】

【技术特征摘要】
1.一种类别比例引导的无监督领域适应建模方法，其特征在于，包括以下步骤：数据准备与初始化：收集训练数据集，所述训练数据集至少包括一训练样本训练源域分类：将源域样本进行随机傅里叶特征变换，得到源域映射样本矩阵训练目标域分类：将目标域样本进行傅里叶特征变换，其中傅里叶特征变换的参数与随机种子与源域中的RFF保持一致，得到目标域映射样本矩阵H
t
，目标域分类器描述为f
t
(x)＝φ(X)B
t
，进而得到最优的源域输出权重矩阵输出目标域分类：输出得到目标域分类器。2.如权利要求1所述一种类别比例引导的无监督领域适应建模方法，其特征在于，所述训练样本中：d为样本的初始特征维度，样本对应的标签为中：d为样本的初始特征维度，样本对应的标签为表示实数域，标签采用独热编码；设收集的源域样本有n
s
个，且每个样本均有标签，则源域样例集合为个，且每个样本均有标签，则源域样例集合为为源域第i个样本，为对应的标签；目标域样本有n
t
，但是没有任何标签，目标域样本集合为集合为为目标域的第i个样本；人工设定训练平衡系数γ1,η1,η2＞0，人工设定比例矩阵＞0，人工设定比例矩阵为目标域类别比例向量。3.如权利要求1所述一种类别比例引导的无监督领域适应建模方法，其特征在于，所述源域映射样本矩阵k为映射后样本维度，源域分类器描述为f
s
(x)＝φ(x)B
s
，为映射函数，为再生核希尔伯特空间，通过求解以下优化问题求解即：其中，4.如权利要求1所述类别比例引导的无监督领域适应建模方法，其特征在于，所述源域和目标域的特征变换方式完全一致...

【专利技术属性】
技术研发人员：吕文君，康宇，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人