【技术实现步骤摘要】
一种基于知识图谱的卷积神经网络的电力物资分类的方法
[0001]本专利技术适属于电力物资分类问题领域,将电力物资进行自动化分类,提高电力物资供应链效率
。
技术介绍
[0002]近年来,随着电力需求的持续增长,各省电力公司加快电力建设,电力物资管理成为电力建设的重要组成部分
。
电力物资种类繁多,标识不统一,目前基于机器学习的电力物资分类方法大多依靠既定规则,无法在庞大的电力物资数据中得到固定的物资分类规则
。
基于深度学习的电力物资分类方法大多忽视文本自带的语义信息,无法充分挖掘电力物资数据文本中包含的分类信息
。
本专利技术对电力物资分类模型进行探究,针对电力物资种类分类问题,提出了基于知识图谱的卷积神经网络电力物资分类模型,首先将数据集中的单条物资数据以知识图谱形式表示,通过预训练模型转化为知识图谱词嵌入表征向量融入卷积神经网络模型中,为卷积神经网络模型提供丰富的物资文本信息,有效提升电力物资分类的效率,提高分类的准确性至
96
%,促进物资仓库的 ...
【技术保护点】
【技术特征摘要】
1.
一种基于知识图谱的卷积神经网络的电力物资分类的方法,其特征在于包括以下步骤:
S1、
数据收集,获取电力物资数据明细;
S2、
数据整理,整合数据明细中的重要信息,所述重要信息包括:物资名称
、
物资种类;
S3、
数据标准化,将物资名称和物资种类中的重复项进行合并归类,将物资数据归为
m
种物资名称,物资种类归为
n
种分类条目;以获得标准化文本数据集;
S4、
数据表征,将标准化文本数据集中的单条物资数据以知识图谱形式表示,得到形式为“物资,物资种类,物资分类”的知识图谱三元组表达形式,使用预训练模型
BERT
将知识图谱三元组表达形式向量化,得到物资数据的知识图谱三元组表达形式的词嵌入表征向量;
S5、
数据分类,将知识图谱词嵌入表征向量输入最优模型中得到物资属于某个物资类别的概率,得到物资分类结果
。2.
根据权利要求1所述的方法,其特征在于,
S4
的具体步骤如下:标准化文本中物资数据与物资分类条目构成知识图谱的三元组表达形式,形式为“物资,物资种类,物资分类”;使用预训练模型
BERT
将知识图谱三元组表达形式进行词嵌入表征,
BERT
是基于
Transformer
编码架构的预训练模型,
Transformer
基于注意力机制由查询向量
query
,键值向量
key
和值向量
value
构成注意力计算公式,如公式
(1)
和公式
(2)
:
Attention(Q,K,V)
=
softmax(A)V#(2)
其中,
K、V、Q
分别表示
key、value、query
,
A
表示计算键向量和查询向量匹配程度的中间向量;
Attention(
·
)
表示计算键向量与查询向量匹配程度的公式;
softmax(
·
)
为归一化指数函数,用于计算
A
的值,
BERT
预训练模型通过已经预训练好的词向量表征得到知识图谱词嵌入表征向量
。3.
根据权利要求1所述的方法,其特征在于,知识图谱词嵌入表征向量进入卷积神经网络的具体内容如下:知识图谱特征映射
C
由过滤器计算滑动窗口所包含的所有可能字段
x
1:h
,x
2:
h+1,
…
,x
n
‑
h+1:n
进行计算,计算公式如下,
C
=
[C1,C2,
…
,C
n
‑
h+1
]#(7)
其中,
C
i
为特征
。4.
根据权利要求3所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:李金霞,卞华星,温富国,丁漫江,程力涵,沈键,周晓宇,黄燕,
申请(专利权)人:国网江苏省电力有限公司物资分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。