一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法技术

技术编号:38153646 阅读:13 留言:0更新日期:2023-07-13 09:19
本发明专利技术涉及电力资产技术领域,尤其为一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法,其方法包括如下步骤:获取电力数据资产的原始数据,并随机从中挑选出多组数据转化为文本数据,在去中心化应用程序中将多组数据按照其用途定义分类,并打上标签,制成标签集;本发明专利技术方法通过图注意力网络技术,模仿人类注意力方式从知识图谱中快速筛选出重要的关键字值信息进行检索,帮助用户快速掌握数据资产知识信息,快速定位查找数据资源,提高数据资产的利用率和获取效率,解决了目前数据资产知识图谱库的数据量庞大且较为复杂,不方便使用者进行查询检索,从而给数据资产的调取和使用带来不便。数据资产的调取和使用带来不便。数据资产的调取和使用带来不便。

【技术实现步骤摘要】
一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法


[0001]本专利技术涉及电力资产
,具体为一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法。

技术介绍

[0002]知识图谱是机器认知智能实现的基石,是人工智能的重要组成部分,在我国仍属于研究的初步阶段。知识图谱技术是基于图数据库技术的一个应用方法,知识图谱提供了一个基于实体和实体关系挖掘和分析的知识表示通用框架。知识图谱是由顶点(或节点)和边组成的语义图。利用知识图谱,可以将分散的实体和概念片段连接在一起,形成一个完整的结构化知识库,便于管理、检索、使用和理解其包含的信息。知识图谱相关技术主要包括知识建模、知识抽取、知识融合知识推理、知识存储、知识应用与界面展示。
[0003]随着电网数据中台的建设与应用,公司快速积累了海量的数据资产。相关技术和业务人员目前面临电网资产数据查询入口多、检索慢、业务人员与数据交互困难等问题,因此需要建立相应的数据资产知识图谱进行集中存储,但是数据资产知识图谱库的数据量庞大且较为复杂,不方便使用者进行查询检索,从而给数据资产的调取和使用带来不便。

技术实现思路

[0004]本专利技术的目的在于提供一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法,其方法包括如下步骤:
[0006]步骤S1:获取电力数据资产的原始数据,并随机从中挑选出多组数据转化为文本数据,在去中心化应用程序中将多组数据按照其用途定义分类,并打上标签,制成标签集;
[0007]步骤S2:构建长短时记忆神经网络,将标签集输入到训练完成的长短时记忆神经网络中,来对标签进行预测,而后将预测的标签与对应数据的标签利用文本对比工具进行文本内容差异对比,选取相似度最高的标签,将去中心化应用程序的标签和关键字的数据组文档与预测的标签组合并,并按照数据集中数据的分布将数据分为训练集与测试集;
[0008]步骤S3:对训练集与测试集进行文本预处理,并将训练集和测试集以csv表格文本的形式保持下来,并将各种同一种标签的文本进行聚合,将这些属性进行重新编码,之后进行数据归一化处理,消除各个训练集与测试集之间的量纲影响;
[0009]步骤S4:构建新的神经网络模型,将处理后的训练集与测试集输入进行训练,在经过多次训练后,得到准确率最高的模型,从而得到能够对关键字属性进行挖掘的检索模型,将检索模型搭载入检索引擎中。
[0010]优选的,所述步骤(S1)中,去中心化应用程序为通过网络节点并通过不同的人来进行去中心化操作的应用。
[0011]优选的,所述步骤(S1)中,使用向量化文本工具将标签集转化为序列化的向量。
[0012]优选的,所述步骤(S2)中,对训练集数据进行数据增强处理,并采用多尺度特征融合的方法来学习不同数据体的特征。
[0013]优选的,所述步骤(S3)中,对训练集进行预处理,生成大小为N1*N2*C的目标训练样本,其中N1和N2分别表示输入神经网络的样本的高度和宽度,C表示输入的数据。
[0014]优选的,所述步骤(S3)中,重新编码是挖掘关键属性用的输入信息。
[0015]优选的,所述步骤(S4)中,对输入检索与搜寻到的标签进行预测,之后获取每个输入文字的权重信息,并根据得到的属性权值信息来对标签属性进行二次筛选,并在筛选后来对神经网络模型进行再次训练。
[0016]优选的,所述步骤(S4)中,将检索引擎连接网络、搜索用户端以及电网中台数据资产知识图谱数据库。
[0017]与现有技术相比,本专利技术的有益效果如下:
[0018]本专利技术方法通过图注意力网络技术,模仿人类注意力方式从知识图谱中快速筛选出重要的关键字值信息进行检索,帮助用户快速掌握数据资产知识信息,快速定位查找数据资源,提高数据资产的利用率和获取效率,解决了目前数据资产知识图谱库的数据量庞大且较为复杂,不方便使用者进行查询检索,从而给数据资产的调取和使用带来不便。
附图说明
[0019]图1为本专利技术方法的流程示意图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]实施例一:
[0022]一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法,其方法包括如下步骤:
[0023]步骤S1:获取电力数据资产的原始数据,并随机从中挑选出多组数据转化为文本数据,在去中心化应用程序中将多组数据按照其用途定义分类,并打上标签,制成标签集,其中去中心化应用程序为通过网络节点并通过不同的人来进行去中心化操作的应用;
[0024]步骤S2:构建长短时记忆神经网络,将标签集输入到训练完成的长短时记忆神经网络中,来对标签进行预测,而后将预测的标签与对应数据的标签利用文本对比工具进行文本内容差异对比,选取相似度最高的标签,将去中心化应用程序的标签和关键字的数据组文档与预测的标签组合并,并按照数据集中数据的分布将数据分为训练集与测试集,其中对训练集数据进行数据增强处理,并采用多尺度特征融合的方法来学习不同数据体的特征;
[0025]步骤S3:对训练集与测试集进行文本预处理,并将训练集和测试集以csv表格文本的形式保持下来,并将各种同一种标签的文本进行聚合,将这些属性进行重新编码,之后进
行数据归一化处理,消除各个训练集与测试集之间的量纲影响,其中对训练集进行预处理,生成大小为N1*N2*C的目标训练样本,其中N1和N2分别表示输入神经网络的样本的高度和宽度,C表示输入的数据;
[0026]步骤S4:构建新的神经网络模型,将处理后的训练集与测试集输入进行训练,在经过多次训练后,得到准确率最高的模型,从而得到能够对关键字属性进行挖掘的检索模型,将检索模型搭载入检索引擎中。
[0027]实施例二:
[0028]一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法,其方法包括如下步骤:
[0029]步骤S1:获取电力数据资产的原始数据,并随机从中挑选出多组数据转化为文本数据,在去中心化应用程序中将多组数据按照其用途定义分类,并打上标签,制成标签集,其中去中心化应用程序为通过网络节点并通过不同的人来进行去中心化操作的应用,且使用向量化文本工具将标签集转化为序列化的向量;
[0030]步骤S2:构建长短时记忆神经网络,将标签集输入到训练完成的长短时记忆神经网络中,来对标签进行预测,而后将预测的标签与对应数据的标签利用文本对比工具进行文本内容差异对比,选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法,其特征在于:其方法包括如下步骤:步骤S1:获取电力数据资产的原始数据,并随机从中挑选出多组数据转化为文本数据,在去中心化应用程序中将多组数据按照其用途定义分类,并打上标签,制成标签集;步骤S2:构建长短时记忆神经网络,将标签集输入到训练完成的长短时记忆神经网络中,来对标签进行预测,而后将预测的标签与对应数据的标签利用文本对比工具进行文本内容差异对比,选取相似度最高的标签,将去中心化应用程序的标签和关键字的数据组文档与预测的标签组合并,并按照数据集中数据的分布将数据分为训练集与测试集;步骤S3:对训练集与测试集进行文本预处理,并将训练集和测试集以csv表格文本的形式保持下来,并将各种同一种标签的文本进行聚合,将这些属性进行重新编码,之后进行数据归一化处理,消除各个训练集与测试集之间的量纲影响;步骤S4:构建新的神经网络模型,将处理后的训练集与测试集输入进行训练,在经过多次训练后,得到准确率最高的模型,从而得到能够对关键字属性进行挖掘的检索模型,将检索模型搭载入检索引擎中。2.根据权利要求1所述的一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法,其特征在于:所述步骤(S1)中,去中心化应用程序为通过网络节点并通过不同的人来进行去中心化操作的应用。3.根据权利要求1所述的一种基于数据资产智能检索输入输出要求设计特...

【专利技术属性】
技术研发人员:冯珺彭梁英王红凯
申请(专利权)人:国网浙江省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1