一种基于图神经网络的卷烟关联性分析方法及系统技术方案

技术编号:38127520 阅读:12 留言:0更新日期:2023-07-08 09:32
本发明专利技术公开了一种基于图神经网络的卷烟关联性分析方法,包括获取卷烟数据;根据卷烟数据构建知识图谱;其中,知识图谱的主节点为卷烟品牌,子节点为卷烟规格,尾节点为卷烟的简介信息以及属性特征;根据知识图谱获取邻接矩阵、标签矩阵以及对应的特征矩阵;利用半监督的学习方式,将邻接矩阵、标签矩阵和对应的特征矩阵输入至图神经网络中进行训练,获得相似度分类模型;将新品卷烟数据输入至相似度分类模型中,获取新品卷烟与其它卷烟的相似度。本发明专利技术利用半监督的方式,在少量标签的情况下训练图神经网络,获得具有节点关联性的相似度分类模型,可快速高效的获取新品卷烟与不同规格的卷烟的相似度。格的卷烟的相似度。格的卷烟的相似度。

【技术实现步骤摘要】
一种基于图神经网络的卷烟关联性分析方法及系统


[0001]本专利技术涉及卷烟分析
,具体涉及一种基于图神经网络的卷烟关联性分析方法及系统。

技术介绍

[0002]在高质量烟叶等原料的基础上,企业需要花大量人力不断地进行市场调研,及时把握市场需求来指导新品卷烟的研制生产。因此,推出新品卷烟的成本更高。而新品卷烟的销售受诸多因素影响,无法确定,这意味着推出新品卷烟是高成本,高风险的。因此,需要一项技术来预知、规避风险,而目前关于卷烟的研究更多地集中在销量的影响因素分析及其预测上,如何知晓新品卷烟的市场行情,为规模生产提供参考,预知风险方面的研究很少。
[0003]近年来,在深度学习技术的推动下,人工智能高速发展,取得了重要成果和广泛应用。然而在实际场景中,有大量数据是在非欧空间,极大程度上限制了深度神经网络的应用。图神经网络作为一种新兴的智能算法,将深度学习算法和图计算算法相融合,取长补短,能处理结构为不规则的非欧几里得空间的复杂图数据。在卷烟数据分析中有些方面会使用图神经网络算法,然而,由于卷烟规格之多,相似度计算之复杂,各种规格卷烟之间的相似度难以用常规的监督学习方法存在复杂繁琐的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种基于图神经网络的卷烟关联性分析方法及系统,以解决现有技术中新品卷烟相似度计算复杂的问题。
[0005]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0006]一种基于图神经网络的卷烟关联性分析方法,包括:
[0007]获取卷烟数据;
[0008]根据卷烟数据构建知识图谱;其中,知识图谱的主节点为卷烟品牌,子节点为卷烟规格,尾节点为卷烟的简介信息以及属性特征;
[0009]根据知识图谱获取邻接矩阵、标签矩阵以及对应的特征矩阵;
[0010]利用半监督的学习方式,将邻接矩阵、标签矩阵和对应的特征矩阵输入至图神经网络中进行训练,获得相似度分类模型;
[0011]将新品卷烟数据输入至相似度分类模型中,获取新品卷烟与其它卷烟的相似度。
[0012]进一步地,所述根据知识图谱获取邻接矩阵、标签矩阵以及对应的特征矩阵包括:
[0013]根据已有经验挑选不同相似度的几组不同规格的卷烟,利用卷烟的特征属性计算其余弦相似度;
[0014]根据知识图谱中子节点与子节点之间的连边关系结合余弦相似度分类,创建邻接矩阵和标签矩阵,并根据子节点对应的尾节点获得特征矩阵。
[0015]进一步地,所述余弦相似度的表达式:
[0016][0017]其中,和分别表示两款卷烟特征属性的n维向量;余弦相似度为0

0.5时为不相似,余弦相似度为0.5

0.7为较相似,余弦相似度为0.7

0.9为相似,余弦相似度为0.9

1.0为极相似。
[0018]进一步地,所述获得相似度分类模型包括如下步骤:
[0019]将邻接矩阵、标签矩阵以及特征矩阵作为初始训练集输入至图神经网络中进行迭代训练,直到损失函数收敛,获得图神经网络的链路分类器以及预测输出矩阵;
[0020]通过softmax函数获得链路分类器对于每条边所属相似类别的置信度,选出置信度最高一个分类结果,将其添加到标签矩阵中,得到新的标签矩阵;
[0021]根据新的标签矩阵继续迭代训练图神经网络的链路分类器,直到标签矩阵被填满,得到最终的相似度分类模型。
[0022]进一步地,所述softmax函数的表达式为:
[0023][0024]其中,z
i
为第i个节点的输出值,C为分类的类别个数。
[0025]进一步地,所述损失函数的表达式为:
[0026][0027]其中,y
i
和f(x
i
)分别表示第i个样本的真实值和预测值,m为样本个数。
[0028]进一步地,所述图神经网络为采用双层GCN的结构图神经网络,其表达式为:
[0029][0030]其中,A为邻接矩阵,X为特征矩阵,为归一化后的邻接矩阵,W
(0)
∈R
M
×
H
和W
(1)
∈R
H
×
F
是两层图卷积层的权重矩阵,
σ
为Relu激活函数。
[0031]进一步地,获取卷烟数据包括:
[0032]采集卷烟企业内部及企业外部的卷烟信息;
[0033]提取卷烟信息中的关键词并进行特征合并,所述关键词包括卷烟品牌、卷烟规格、简介信息以及属性特征;
[0034]处理合并后的卷烟信息获取数字特征,对数字特征进行标准化操作并剔除不良数据,获取卷烟数据。
[0035]一种基于图神经网络的卷烟关联性分析系统,包括处理器及存储介质;
[0036]所述存储介质用于存储指令;
[0037]所述处理器用于根据所述指令进行操作以执行第一方面任一项所述方法的步骤。
[0038]计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一项所述方法的步骤。
[0039]根据上述技术方案,本专利技术的有益效果为:本专利技术根据卷烟数据构建图神经网络处理的知识图谱,使用图神经网络处理复杂和非欧几里的卷烟数据,并利用半监督的方式,在少量标签的情况下训练图神经网络,获得具有节点关联性的相似度分类模型,通过将新品卷烟数据输入至似度分类模型中,可快速高效的获取新品卷烟与不同规格的卷烟的相似度。
附图说明
[0040]图1为本专利技术的整体流程图;
[0041]图2为本专利技术中图神经网络的结构图;
[0042]图3为本专利技术中半监督学习方法训练图神经网络的流程图。
具体实施方式
[0043]为使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本专利技术。
[0044]本专利技术利用历史的卷烟数据与卷烟新品进行关联性分析,根据关联性的大小判断卷烟新品在市场上的销售情况。
[0045]在卷烟的图数据中,中心节点表示品牌,子节点为规格,尾节点表示子节点的属性特征(即卷烟属性),包括卷烟的焦油含量,卷烟长度,粗细,历史销售数据等。它是从非欧几里得域生成的,并表示为具有复杂关系和对象之间相互依赖的图形,其复杂性和不规则性让传统的神经网络难以成功训练,图神经网络却能够高效地利用卷烟样本之间的结构属性特征,能够充分挖掘数据蕴含的丰富信息,将不同样本之间的关系进行有效的表达,从而达到最大化利用图数据结构特征的目的。
[0046]基于此,本专利技术设计了一种基于半监督图神经网络的卷烟关联性分析方法,通过构建知识图谱,获取卷烟图数据,并利用半监督的方式训练图神经网络模型预测卷烟之间的关联性,从而帮助判断新品烟与其他卷烟的相似程度,预测新品烟在市场上的销售动向。
[0047]实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的卷烟关联性分析方法,其特征在于,包括:获取卷烟数据;根据卷烟数据构建知识图谱;其中,知识图谱的主节点为卷烟品牌,子节点为卷烟规格,尾节点为卷烟的简介信息以及属性特征;根据知识图谱获取邻接矩阵、标签矩阵以及对应的特征矩阵;利用半监督的学习方式,将邻接矩阵、标签矩阵和对应的特征矩阵输入至图神经网络中进行训练,获得相似度分类模型;将新品卷烟数据输入至相似度分类模型中,获取新品卷烟与其它卷烟的相似度。2.根据权利要求1所述的卷烟关联性分析方法,其特征在于,所述根据知识图谱获取邻接矩阵、标签矩阵以及对应的特征矩阵包括:根据已有经验挑选不同相似度的几组不同规格的卷烟,利用卷烟的特征属性计算其余弦相似度;根据知识图谱中子节点与子节点之间的连边关系结合余弦相似度分类,创建邻接矩阵和标签矩阵,并根据子节点对应的尾节点获得特征矩阵。3.根据权利要求2所述的卷烟关联性分析方法,其特征在于,所述余弦相似度的表达式:其中,和分别表示两款卷烟特征属性的n维向量;余弦相似度为0

0.5时为不相似,余弦相似度为0.5

0.7为较相似,余弦相似度为0.7

0.9为相似,余弦相似度为0.9

1.0为极相似。4.根据权利要求2所述的卷烟关联性分析方法,其特征在于,所述获得相似度分类模型包括如下步骤:将邻接矩阵、标签矩阵以及特征矩阵作为初始训练集输入至图神经网络中进行迭代训练,直到损失函数收敛,获得图神经网络的链路分类器以及预测输出矩阵;通过softmax函数获得链路分类器对于每条边所属相似类别的置信度,选出置信度最高一个分类结果,将其添加到标签矩阵中,得到新的标签矩阵;根据新的标签矩阵继续迭代训练图神...

【专利技术属性】
技术研发人员:金泳楼卫东高扬华
申请(专利权)人:浙江中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1