一种信息识别方法、信息识别系统、电子设备及计算机可读存储介质技术方案

技术编号：34270157 阅读：14 留言：0更新日期：2022-07-24 15:50

本发明专利技术公开一种信息识别方法，学习阶段包括步骤：将包含多个样本类别、多个样本域的训练样本集S划分为模拟训练样本集DS和模拟测试样本集DT；将模拟训练样本集DS的各个类别c的样本数据x

An information recognition method, information recognition system, electronic equipment and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种信息识别方法、信息识别系统、电子设备及计算机可读存储介质

[0001]本申请涉及人工智能领域，具体涉及一种信息识别方法、信息识别系统、电子设备及计算机可读存储介质。

技术介绍

[0002]人工智能(AI，Artificial Intelligence)领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
[0003]人工智能的核心是机器学习。在机器学习中，通过标签已知的训练数据(也称为学习数据)进行学习，优化算法模型的参数，对标签未知的测试数据进行识别。
[0004]在机器学习中，当训练数据和测试数据存在较大差异时，机器学习中使用的训练数据与测试数据不同，导致对测试数据进行识别时，识别性能下降，存在很大的不确定性，影响系统性能。
[0005]因此，领域泛化技术(Domain Generalization)受到越来越多的关注，其要解决的问题是如何利用训练数据训练一个模型，使得该模型能够泛化到其他不同数据分布的目标领域，减小对测试数据进行识别时的不确定性，提高机器学习算法对新样本的适应能力，即，提高机器学习的泛化能力(generalization ability)。领域泛化技术中，训练数据集也称为源域，测试数据集也称为目标域。领域泛化的训练数据和测试数据来源于不同领域、且具有不同分布的数据，一般的领域泛化方法是尽量抽取不同领域数据中和领域无关的信息，或者学习得到隐含在不同领域数据背后的规律，使其在面对新领域数据时，可能得到合理的性能。
[0006]现有技术中，主要通过元...

【技术保护点】

【技术特征摘要】
1.一种信息识别方法，其特征在于，学习阶段包括以下步骤：步骤S11，将包含多个样本类别、多个样本域的训练样本集S划分为模拟训练样本集DS和模拟测试样本集DT；步骤S12，将所述模拟训练样本集DS的各个类别c的样本数据x
sc
、所述样本数据x
sc
的类别标签y
sc
输入编码器网络，所述编码器网络生成所述样本数据x
sc
的各个类别c在潜在空间的第一分布；步骤S13，将所述模拟测试样本集DT的样本数据x
t
输入先验网络，所述先验网络生成所述样本数据x
t
在所述潜在空间的第二分布；步骤S14，计算各个类别c的所述第一分布之和与所述第二分布之间的KL距离，使该KL距离最小。2.根据权利要求1所述的信息识别方法，其特征在于，还包括：步骤S15，将所述模拟测试样本集DT的样本数据x
t
以及所述第一分布的参数输入解码器网络，所述解码器网络基于所述模拟测试样本集DT的样本数据x
t
以及所述第一分布的参数，生成所述样本数据x
t
的预测类别标签使所述预测类别标签与所述样本数据x
t
的已知类别标签y
t
的交叉熵最小。3.根据权利要求2所述的信息识别方法，其特征在于，测试阶段包括以下步骤：步骤S31，将测试样本集T的测试样本数据x输入所述先验网络，所述先验网络生成所述测试样本数据x在潜在空间的第三分布；步骤S32，将所述测试样本数据x和所述第三分布的参数输入所述解码器网络，所述解码器网络根据所述第三分布的参数生成所述测试样本数据x的预测类别标签4.根据权利要求3所述的信息识别方法，其特征在于，步骤S12中，不同类别的所述样本数据x
cs
的所述第一分布之间的Wasserstein距离L
W
最大。5.根据权利要求1所述的信息识别方法，其特征在于，步骤S11中，在所述训练样本集S的多个样本域中，随机选择一个样本域作为所述模拟测试样本集DT，其余的样本域作为所述模拟训练样本集DS。6.根据权利要求2所述的信息识别方法，其特征在于，步骤S15中，对所述第一分布进行多次采样，将多个采样值z
l
以及所述样本数据x
t
输入所述解码器网络，得到多个预测类别标签，对该多个预测类别标签取平均，将得到的平均值作为所述样本数据x
t
的预测类别标签7.根据权利要求4所述的信息识别方法，其特征在于，计算整体损失函数如式(1)：其中，为交叉熵，D
KL
为KL距离，为Wasserstein距离，根据式(2)，利用梯度下降法更...

【专利技术属性】
技术研发人员：张磊，刘心，甄先通，左利云，王宝艳，
申请(专利权)人：广东石油化工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人