【技术实现步骤摘要】
一种信息识别方法、信息识别系统、电子设备及计算机可读存储介质
[0001]本申请涉及人工智能领域,具体涉及一种信息识别方法、信息识别系统、电子设备及计算机可读存储介质。
技术介绍
[0002]人工智能(AI,Artificial Intelligence)领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
[0003]人工智能的核心是机器学习。在机器学习中,通过标签已知的训练数据(也称为学习数据)进行学习,优化算法模型的参数,对标签未知的测试数据进行识别。
[0004]在机器学习中,当训练数据和测试数据存在较大差异时,机器学习中使用的训练数据与测试数据不同,导致对测试数据进行识别时,识别性能下降,存在很大的不确定性,影响系统性能。
[0005]因此,领域泛化技术(Domain Generalization)受到越来越多的关注,其要解决的问题是如何利用训练数据训练一个模型,使得该模型能够泛化到其他不同数据分布的目标领域,减小对测试数据进行识别时的不确定性,提高机器学习算法对新样本的适应能力,即,提高机器学习的泛化能力(generalization ability)。领域泛化技术中,训练数据集也称为源域,测试数据集也称为目标域。领域泛化的训练数据和测试数据来源于不同领域、且具有不同分布的数据,一般的领域泛化方法是尽量抽取不同领域数据中和领域无关的信息,或者学习得到隐含在不同领域数据背后的规律,使其在面对新领域数据时,可能得到合理的性能。
[0006]现有技术中,主要通过元 ...
【技术保护点】
【技术特征摘要】
1.一种信息识别方法,其特征在于,学习阶段包括以下步骤:步骤S11,将包含多个样本类别、多个样本域的训练样本集S划分为模拟训练样本集DS和模拟测试样本集DT;步骤S12,将所述模拟训练样本集DS的各个类别c的样本数据x
sc
、所述样本数据x
sc
的类别标签y
sc
输入编码器网络,所述编码器网络生成所述样本数据x
sc
的各个类别c在潜在空间的第一分布;步骤S13,将所述模拟测试样本集DT的样本数据x
t
输入先验网络,所述先验网络生成所述样本数据x
t
在所述潜在空间的第二分布;步骤S14,计算各个类别c的所述第一分布之和与所述第二分布之间的KL距离,使该KL距离最小。2.根据权利要求1所述的信息识别方法,其特征在于,还包括:步骤S15,将所述模拟测试样本集DT的样本数据x
t
以及所述第一分布的参数输入解码器网络,所述解码器网络基于所述模拟测试样本集DT的样本数据x
t
以及所述第一分布的参数,生成所述样本数据x
t
的预测类别标签使所述预测类别标签与所述样本数据x
t
的已知类别标签y
t
的交叉熵最小。3.根据权利要求2所述的信息识别方法,其特征在于,测试阶段包括以下步骤:步骤S31,将测试样本集T的测试样本数据x输入所述先验网络,所述先验网络生成所述测试样本数据x在潜在空间的第三分布;步骤S32,将所述测试样本数据x和所述第三分布的参数输入所述解码器网络,所述解码器网络根据所述第三分布的参数生成所述测试样本数据x的预测类别标签4.根据权利要求3所述的信息识别方法,其特征在于,步骤S12中,不同类别的所述样本数据x
cs
的所述第一分布之间的Wasserstein距离L
W
最大。5.根据权利要求1所述的信息识别方法,其特征在于,步骤S11中,在所述训练样本集S的多个样本域中,随机选择一个样本域作为所述模拟测试样本集DT,其余的样本域作为所述模拟训练样本集DS。6.根据权利要求2所述的信息识别方法,其特征在于,步骤S15中,对所述第一分布进行多次采样,将多个采样值z
l
以及所述样本数据x
t
输入所述解码器网络,得到多个预测类别标签,对该多个预测类别标签取平均,将得到的平均值作为所述样本数据x
t
的预测类别标签7.根据权利要求4所述的信息识别方法,其特征在于,计算整体损失函数如式(1):其中,为交叉熵,D
KL
为KL距离,为Wasserstein距离,根据式(2),利用梯度下降法更...
【专利技术属性】
技术研发人员:张磊,刘心,甄先通,左利云,王宝艳,
申请(专利权)人:广东石油化工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。