一种基于数据分析的工程施工材料供应链管理系统技术方案

技术编号:39752730 阅读:6 留言:0更新日期:2023-12-17 23:51
本发明专利技术公开了一种基于数据分析的工程施工材料供应链管理系统,属于语义识别技术领域,本发明专利技术中通过采集工程施工材料供应链表单的图像,并对图像进行文字识别,从而得到文字信息,实现自动录入工程施工材料供应链表单,再通过实体提取子系统提取文字信息中的实体,再采用实体关系提取子系统提取文字信息中的实体关系,根据实体与实体关系构建知识图谱,从而实现对整体的供应链架构的呈现,再对知识图谱进行加密处理,从而防止第三方窃取,提高信息保密性

【技术实现步骤摘要】
一种基于数据分析的工程施工材料供应链管理系统


[0001]本专利技术涉及语义识别
,具体涉及一种基于数据分析的工程施工材料供应链管理系统


技术介绍

[0002]在工程中,工程施工材料供应链信息为众多文档资料,在每次使用时,都需将新的文档资料录入到计算机系统,其在录入过程中,容易因为个人因素而录错信息,造成采购时的经济损失

同时,工程中所需材料众多,施工材料的供应商又分布在不同地区,且价格不同,优势不同,需要将所有施工材料的供应商罗列出来,进行精细化对比,从而获得采购方案

[0003]现有的供应链管理系统主要用于简单统计各个订单的供应商信息

价格和地点等具体信息,无法对整体的供应链架构进行呈现,且所有的工程施工材料供应链的信息存储在计算机系统中,更便于第三方窃取,保密性差


技术实现思路

[0004]针对现有技术中的上述不足,本专利技术提供的一种基于数据分析的工程施工材料供应链管理系统解决了以下问题:
1、
手动录入文档资料的录入时间长,且容易出错;
2、
现有的供应链管理系统无法对整体的供应链架构进行呈现;
3、
工程施工材料供应链的信息存储在计算机系统中,保密性差

[0005]为了达到上述专利技术目的,本专利技术采用的技术方案为:一种基于数据分析的工程施工材料供应链管理系统,包括:工程施工材料供应链表单采集子系统

文字识别子系

实体提取子系统

实体关系提取子系统

知识图谱构建子系统和知识图谱加密子系统;工程施工材料供应链表单采集子系统用于采集工程施工材料供应链表单的图像;文字识别子系统用于对图像上的文字进行识别,得到文字信息;实体提取子系统用于提取文字信息中的实体;实体关系提取子系统用于提取文字信息中的实体关系;知识图谱构建子系统用于根据实体和实体关系,构建供应链知识图谱;知识图谱加密子系统用于对供应链知识图谱进行加密,得到加密图谱数据

[0006]进一步地,实体提取子系统包括:第一分段单元

第一特征提取单元

第一特征融合单元和第一
CRF
神经网络;第一分段单元用于对文字信息进行分段处理,得到多个文字子段信息;第一特征提取单元用于对文字子段信息进行特征提取,得到文字子段特征;第一特征融合单元用于对各文字子段特征进行加权,并对加权后的特征进行拼接操作,得到融合特征;第一
CRF
神经网络对融合特征进行分类,得到文字信息中的实体

[0007]上述进一步地方案的有益效果为:本专利技术中采用分段单元对文字信息进行分段处
理,从而实现对信息的切分,在每个文字子段信息中充分提取文字子段特征,再根据每个文字子段特征的情况,对各文字子段特征进行加权处理,再进行拼接操作,能实现根据每个文字子段特征的情况,自适应的调节文字子段特征的权重,便于各特征的体现,进行拼接操作,实现特征的汇集,将汇集特征输入
CRF
神经网络进行分类,通过前面结构对特征的充分提取,提高
CRF
神经网络的分类精度

[0008]进一步地,实体关系提取子系统包括:第二分段单元

第二特征提取单元

第二特征融合单元

第一
LSTM
单元

第二
LSTM
单元
、Concat
单元和第二
CRF
神经网络;第二分段单元用于对文字信息进行分段处理,得到文字子段信息;第二特征提取单元用于对文字子段信息进行特征提取,得到文字子段特征;第二特征融合单元用于对各文字子段特征进行加权,并对加权后的特征进行拼接操作,得到融合特征;第一
LSTM
单元用于对融合特征提取第一时间特征;第一
LSTM
单元用于对融合特征提取第二时间特征;
Concat
单元用于将第一时间特征和第二时间特征进行拼接,得到拼接时间特征;第二
CRF
神经网络用于对拼接时间特征进行分类,得到文字信息中的实体关系

[0009]上述进一步地方案的有益效果为:本专利技术中实体关系提取子系统比实体提取子系统多了两个
LSTM
单元,由于实体关系提取子系统提取的是实体关系,因此,其更需要综合前后语义信息,因此,利用
LSTM
单元的记忆性,提高提取实体关系的精度

[0010]进一步地,第一特征提取单元或第二特征提取单元包括:第一特征提取子单元和第二特征提取子单元;第一特征提取子单元用于将文字子段信息分成多个向量,并对每个向量加权处理,得到特征值;第二特征提取子单元用于对所有特征值取平均值和最大特征值,并与特征值进行拼接,得到文字子段特征

[0011]进一步地,第一特征提取子单元的表达式为:;其中,为第个特征值,为文字子段信息中第个向量,为第个权重向量

[0012]进一步地,第二特征提取子单元的表达式为:;其中,为文字子段特征,为所有特征值的平均值,为最大特征值,为将

和所有进行拼接

[0013]上述进一步地方案的有益效果为:本专利技术再将文字子段信息切分成多份,将每份向量进行加权处理,提取特征值,再从各个特征值中计算出平均值表征整个文字子段信息的整体水平,再筛选出最大值表征整个文字子段信息的显著特征,最终与所有特征值进行拼接,解决梯度消失的问题,防止特征提取过程中特征丢失

[0014]进一步地,第一特征融合单元或第二特征融合单元的表达式为:
;其中,为融合特征,为将个进行拼接,为双曲正切函数,为对数函数,为以自然常数为底的指数函数,为取的平均值,为第个文字子段特征,为文字子段特征的数量

[0015]上述进一步地方案的有益效果为:本专利技术中对每个文字子段特征取平均值,利用进行线性放大,再采用函数获取各个文字子段特征的权重值,根据各自的权重值对各文字子段特征进行加权,自适应的调节文字子段特征的权重,便于各特征的体现,进行拼接操作,实现特征的汇集

[0016]进一步地,实体提取子系统和实体关系提取子系统在应用时,采用是训练完成后的实体提取子系统和实体关系提取子系统,训练实体提取子系统和实体关系提取子系统的损失函数为:;;;;其中,为损失值,为最大差值,为第一比例系数,为第二比例系数,为差值阈值,为自然常数,为第次训练时的标签,为第次训练时实体提取子系统或实体关系提取子系统的输出,用于表示当前的第次训练,用于表示在第次训练邻域的第次训练,为训练次数,为在取最大差值时对应的标签,为在取最大差值时对应的实体提取子系统或实体关系提取子系统的输出,为对数函数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于数据分析的工程施工材料供应链管理系统,其特征在于,包括:工程施工材料供应链表单采集子系统

文字识别子系统

实体提取子系统

实体关系提取子系统

知识图谱构建子系统和知识图谱加密子系统;所述工程施工材料供应链表单采集子系统用于采集工程施工材料供应链表单的图像;所述文字识别子系统用于对图像上的文字进行识别,得到文字信息;所述实体提取子系统用于提取文字信息中的实体;所述实体关系提取子系统用于提取文字信息中的实体关系;所述知识图谱构建子系统用于根据实体和实体关系,构建供应链知识图谱;所述知识图谱加密子系统用于对供应链知识图谱进行加密,得到加密图谱数据
。2.
根据权利要求1所述的基于数据分析的工程施工材料供应链管理系统,其特征在于,所述实体提取子系统包括:第一分段单元

第一特征提取单元

第一特征融合单元和第一
CRF
神经网络;所述第一分段单元用于对文字信息进行分段处理,得到多个文字子段信息;所述第一特征提取单元用于对文字子段信息进行特征提取,得到文字子段特征;所述第一特征融合单元用于对各文字子段特征进行加权,并对加权后的特征进行拼接操作,得到融合特征;所述第一
CRF
神经网络对融合特征进行分类,得到文字信息中的实体
。3.
根据权利要求2所述的基于数据分析的工程施工材料供应链管理系统,其特征在于,所述实体关系提取子系统包括:第二分段单元

第二特征提取单元

第二特征融合单元

第一
LSTM
单元

第二
LSTM
单元
、Concat
单元和第二
CRF
神经网络;所述第二分段单元用于对文字信息进行分段处理,得到文字子段信息;所述第二特征提取单元用于对文字子段信息进行特征提取,得到文字子段特征;所述第二特征融合单元用于对各文字子段特征进行加权,并对加权后的特征进行拼接操作,得到融合特征;所述第一
LSTM
单元用于对融合特征提取第一时间特征;所述第一
LSTM
单元用于对融合特征提取第二时间特征;所述
Concat
单元用于将第一时间特征和第二时间特征进行拼接,得到拼接时间特征;所述第二
CRF
神经网络用于对拼接时间特征进行分类,得到文字信息中的实体关系
。4.
根据权利要求3所述的基于数据分析的工程施工材料供应链管...

【专利技术属性】
技术研发人员:梁艳仙李会敏余成影
申请(专利权)人:成都航空职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1