【技术实现步骤摘要】
一种多标签文本分类物流供应商推荐方法
[0001]本专利技术涉及网络物流
,具体而言,涉及一种基于图卷积神经网络的多标签文本分类物流供应商推荐方法
。
技术介绍
[0002]随着互联网
、
移动互联网
、
人工智能等新一代信息技术的快速发展,通过网络开展物流供应商的选择,已经成为众多物流制造商选择供应商的主要方式
。
但是,目前网络原材料供应商系统仍存在有待解决的问题:
[0003]1、
在海量数据面前,虚假信息越来越多,制造商无法确认供应商的信息是否真实,导致制造商无法快速精准找到适合的供应商;
[0004]2、
制造商无法根据自身的需求和供应商提供的原材料做出最优的选择,导致制造商选对供应商的成功率下降,并且增加了制造商的筛选压力;
[0005]3、
制造商可能会盲目考察供应商,导致效率低下
。
技术实现思路
[0006]本专利技术在于提供一种基于图卷积神经网络的多标签文本分类物流供应商推荐方法,以解决在海量的物流供应商信息中,如何保证物流制造商和物流供应商信息的真实和有效,并提高供应商推荐的准确率和成功率的问题
。
[0007]本专利技术采取的技术方案如下:
[0008]一种多标签文本分类物流供应商推荐方法,包括以下步骤:
[0009]S1、
获取制造商和供应商信息的历史文本集,并进行预训练,得到训练样本集;
[0010]S2、r/>基于双向门控循环单元,建立训练样本集的文本特征图;
[0011]S3、
根据文本特征图构建文本异构矩阵;
[0012]S4、
对文本特征图进行语义注意力融入,并进行标注,生成多标签文本特征图;
[0013]S5、
将多标签文本特征图与文本异构矩阵相乘获得多标签文本分类模型;
[0014]S6、
将图卷积神经网络与多标签文本分类模型融合,得到基于图卷积神经网络的多标签文本分类物流供应商推荐模型;
[0015]S7、
将待分类的制造商和供应商信息的多标签文本特征图输入基于图卷积神经网络的多标签文本分类物流供应商推荐模型,输出得到预测结果;
[0016]S8、
对预测结果进行评价,得到评价结果;
[0017]S9、
将评价结果和预测结果作为最终的推荐结果并输出
。
[0018]在本专利技术的一较佳实施方式中,步骤
S2
具体包括:
[0019]设
D
=
[d1,
d2,
...
,
d
n
],
D
为物流供应商和物流制造商的文本信息嵌入矩阵,
d
i
为特征词,通过
Bi
‑
GRU
构建文本表示如下:
[0020][0021][0022]其中,为公式
GRU(
·
)
从前向后计算的前向隐状态,包含了当前词
d
i
与其之前词语的关系信息;为公式
GRU(
·
)
从后向前计算的后向隐状态,包含了当前词
d
i
与其之后词语的关系信息;
h
i
为双向向量的拼接表示,
[0023]整个文本表示为:
[0024][0025]其中,
[0026]给定一个标签
lj
,标签表示为:
[0027][0028]计算双向门控循环单元的重置门
r
i
和更新门
z
i
:
[0029]r
i
=
σ
(w
r
h
i
‑1+u
r
x
i
+b
r
)
[0030]z
i
=
σ
(w
z
h
i
‑1+u
z
x
i
+b
z
)
[0031]其中,
σ
为
Sigmoid
激活函数,
w
r
,
u
r
为重置门的权重,
w
z
,
u
z
为更新门的权重,
b
r
为重置门的偏置值,
b
z
为更新门的偏置值,
x
i
∈[0
,
1];
[0032]通过候选隐藏状态计算隐含状态
h
i
,计算公式为:
[0033][0034][0035]根据隐藏状态
h
i
构建文本特征图
G
=
(V
,
E)
,节点集合
V
包含了物流供应商和物流制造商信息的文本特征,边集合
E
则包含了每个节点之间的关系
。
[0036]在本专利技术的一较佳实施方式中,步骤
S3
具体包括:
[0037]将文本特征图的各边权值表示为:
[0038][0039]即若
x
,
y
都为词时,通过
PPMI
计算出边权值;若
x
为词,
y
为文本时,通过
TF
‑
IWF
计算边权值;若
x
,
y
都为词且相同时,则边权值设为1;其余情况则边权值为0;
[0040]设
k
个节点
υ
i
∈y
,
(v
i
,
v
j
)∈E
,则有:
[0041]G
ij
=
(v
i
,
v
j
)
[0042]根据文本特征图构建归一化的文本异构矩阵为:
[0043][0044]在本专利技术的一较佳实施方式中,
[0045][0046]其中,
word1
,
word2
为特征词,
p(word
x
,
word2)
表示
word1
和
word2
共同出现的概率,
p(word1)、p(word2)
分别表示
word1、word2
单独出现的概率
。
[0047]在本专利技术的一较佳实施方式中,
[0048][0049]其中,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种多标签文本分类物流供应商推荐方法,其特征在于,包括以下步骤:
S1、
获取制造商和供应商信息的历史文本集,并进行预训练,得到训练样本集;
S2、
基于双向门控循环单元,建立训练样本集的文本特征图;
S3、
根据文本特征图构建文本异构矩阵;
S4、
对文本特征图进行语义注意力融入,并进行标注,生成多标签文本特征图;
S5、
将多标签文本特征图与文本异构矩阵相乘获得多标签文本分类模型;
S6、
将图卷积神经网络与多标签文本分类模型融合,得到基于图卷积神经网络的多标签文本分类物流供应商推荐模型;
S7、
将待分类的制造商和供应商信息的多标签文本特征图输入基于图卷积神经网络的多标签文本分类物流供应商推荐模型,输出得到预测结果;
S8、
对预测结果进行评价,得到评价结果;
S9、
将评价结果和预测结果作为最终的推荐结果并输出
。2.
根据权利要求1所述的多标签文本分类物流供应商推荐方法,其特征在于,步骤
S2
具体包括:设
D
=
[d1,
d2,
...
,
d
n
]
,
D
为物流供应商和物流制造商的文本信息嵌入矩阵,
d
i
为特征词,通过
Bi
‑
GRU
构建文本表示如下:构建文本表示如下:其中,为公式
GRU(
·
)
从前向后计算的前向隐状态,包含了当前词
d
i
与其之前词语的关系信息;为公式
GRU(
·
)
从后向前计算的后向隐状态,包含了当前词
d
i
与其之后词语的关系信息;
h
i
为双向向量的拼接表示,整个文本表示为:其中,给定一个标签
lj
,标签表示为:计算双向门控循环单元的重置门
r
i
和更新门
z
i
:
r
i
=
σ
(w
r
h
i
‑1+u
r
x
i
+b
r
)z
i
=
σ
(w
z
h
i
‑1+u
z
x
i
+b
z
)
其中,
σ
为
Sigmoid
激活函数,
w
r
,
u
r
为重置门的权重,
w
z
,
u
z
为更新门的权重,
b
r
为重置门的偏置值,
b
z
为更新门的偏置值,
x
i
∈[0
,
1]
;通过候选隐藏状态计算隐含状态
h
i
,计算公式为:
根据隐藏状态
h
i
构建文本特征图
G
=
(V,E)
,节点集合
V
包含了物流供应商和物流制造商的文本信息特征,边集合
E
则包含了每个节点之间的关系
。3.
根据权利要求2所述的多标签文本分类物流供应商推荐方法,其特征在于,步骤
S3
具体包括:将文本特征图的各边权值表示为:即若
x,y
都为词时,通过
PPMI
计算出边权值;若
x
为词,
y
为文本时,通过
TF
‑
IWF
计算边权值;若
x
,
y
都为词且相同时,则边权值设为1;其余情况则边权值为0;设
k
个节点
v
i
∈V
,
...
【专利技术属性】
技术研发人员:李松钊,陆建波,马小雅,隆广庆,
申请(专利权)人:南宁师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。