基于多头自注意力超图神经网络的数据分类方法及装置制造方法及图纸

技术编号：35095689 阅读：15 留言：0更新日期：2022-10-01 16:58

本申请涉及数据标签处理技术领域，特别涉及一种基于多头自注意力超图神经网络的数据分类方法及装置，其中，方法包括：提取至少一个样本数据的数据特征；将数据特征输入预设的基于多头自注意力机制的超图构建模块中，生成超图结构；将超图结构和数据特征输入至预设超图神经网络中，输出数据标签预测值，并基于数据标签预测值训练模型，得到用于数据分类的数据分类模型。由此，解决了相关技术中难以自适应对复杂数据和下游任务的超图建模，并且不利于优化超图结构，无法准确的建模数据关联关系，从而降低了数据标签的预测性能等问题。从而降低了数据标签的预测性能等问题。从而降低了数据标签的预测性能等问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于多头自注意力超图神经网络的数据分类方法及装置

[0001]本申请涉及数据标签处理
，特别涉及一种基于多头自注意力超图神经网络的数据分类方法及装置。

技术介绍

[0002]相关技术中，超图由于其强大的高阶关联建模能力近年来受到广泛关注，研究者们发现在机器学习模型中引入超图结构，其中，超图神经网络结合了超图建模和神经网络的优势，在分类、聚类等任务上都体现出了性能的优越性。
[0003]然而，相关技术中由于受到数据噪声、数据缺失的影响时，构建的超图结构存在大量冗余错误的连接，造成难以自适应对复杂数据和下游任务的超图建模，并且不利于优化超图结构，无法准确的建模数据关联关系，从而降低了数据标签的预测性，亟待解决。

技术实现思路

[0004]本申请是基于专利技术人对以下问题的认识和发现作出的：
[0005]超图是一种常用的建模数据间高阶关联的方法，它包括一个节点集合和一个超边集合，一条超边可以连接多个顶点。举例而言，在推荐系统中，一个商品会推送给多个对它感兴趣的用户，那么就可以把一个用户看作一个顶点，一件商品看作一条超边，如果某用户对该商品感兴趣，那么对应的节点就被该超边包含，否则就不被该超边包含。超图由于其强大的高阶关联建模能力近年来受到广泛关注，研究者们发现在机器学习模型中引入超图结构，在学习过程中考虑多个样本之间的高阶关联信息可以获得更好的下游任务性能。其中，超图神经网络结合了超图建模和神经网络的优势，在分类、聚类等任务上都体现出了性能的优越性。
[0006]然而，传统的超

【技术保护点】

【技术特征摘要】
1.一种基于多头自注意力超图神经网络的数据分类方法，其特征在于，包括以下步骤：提取至少一个样本数据的数据特征；将所述数据特征输入预设的基于多头自注意力机制的超图构建模块中，生成超图结构；以及将所述超图结构和所述数据特征输入至预设超图神经网络中，输出数据标签预测值，并基于所述数据标签预测值训练模型，得到用于数据分类的数据分类模型。2.根据权利要求1所述的方法，其特征在于，所述将所述数据特征输入预设的基于多头自注意力机制的超图构建模块中，生成超图结构，包括：基于所述预设的基于多头自注意力机制的超图构建模块，计算所述每个头的注意力分数；根据所述每个头的注意力分数得到关联矩阵，并利用所述关联矩阵表示所述超图结构。3.根据权利要求2所述的方法，其特征在于，所述将所述超图结构和所述数据特征输入至预设超图神经网络中，输出数据标签预测值，包括：计算所述至少一个样本数据的标签向量，得到所有样本数据的标签向量集合；基于所述标签向量集合，计算所述超图结构中超图的超边权重对角矩阵和节点度数对角矩阵；根据所述超边权重对角矩阵和节点度数对角矩阵利用所述预设超图神经网络获取所述至少一个样本数据的数据标签预测值。4.根据权利要求3所述的方法，其特征在于，所述数据标签预测值的计算公式为：其中，表示样本数据的标签预测值，Z
(2)
表示输出第二层隐藏层，W
out
和b
out
表示输出层的偏差参数。5.根据权利要求3或4所述的方法，其特征在于，所述基于所述数据标签预测值训练模型，得到用于数据分类的数据分类模型，包括：根据所述至少一个样本数据的数据标签预测值、初始值、所述数据特征和所述关联矩阵计算所述超图结构的平滑性约束惩罚项和预测误差项；将所述平滑性约束惩罚项和所述预测误差项相加得到损失...

【专利技术属性】
技术研发人员：高跃，张子昭，闫循石，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人