一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法技术

技术编号：38153646 阅读：13 留言：0更新日期：2023-07-13 09:19

本发明专利技术涉及电力资产技术领域，尤其为一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法，其方法包括如下步骤：获取电力数据资产的原始数据，并随机从中挑选出多组数据转化为文本数据，在去中心化应用程序中将多组数据按照其用途定义分类，并打上标签，制成标签集；本发明专利技术方法通过图注意力网络技术，模仿人类注意力方式从知识图谱中快速筛选出重要的关键字值信息进行检索，帮助用户快速掌握数据资产知识信息，快速定位查找数据资源，提高数据资产的利用率和获取效率，解决了目前数据资产知识图谱库的数据量庞大且较为复杂，不方便使用者进行查询检索，从而给数据资产的调取和使用带来不便。数据资产的调取和使用带来不便。数据资产的调取和使用带来不便。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法

[0001]本专利技术涉及电力资产
，具体为一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法。

技术介绍

[0002]知识图谱是机器认知智能实现的基石，是人工智能的重要组成部分，在我国仍属于研究的初步阶段。知识图谱技术是基于图数据库技术的一个应用方法，知识图谱提供了一个基于实体和实体关系挖掘和分析的知识表示通用框架。知识图谱是由顶点(或节点)和边组成的语义图。利用知识图谱，可以将分散的实体和概念片段连接在一起，形成一个完整的结构化知识库，便于管理、检索、使用和理解其包含的信息。知识图谱相关技术主要包括知识建模、知识抽取、知识融合知识推理、知识存储、知识应用与界面展示。
[0003]随着电网数据中台的建设与应用，公司快速积累了海量的数据资产。相关技术和业务人员目前面临电网资产数据查询入口多、检索慢、业务人员与数据交互困难等问题，因此需要建立相应的数据资产知识图谱进行集中存储，但是数据资产知识图谱库的数据量庞大且较为复杂，不方便使用者进行查询检索，从而给数据资产的调取和使用带来不便。

技术实现思路

[0004]本专利技术的目的在于提供一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法，以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的，本专利技术提供如下技术方案：一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法，其方法包括如下步骤：
[00...

【技术保护点】

【技术特征摘要】
1.一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法，其特征在于：其方法包括如下步骤：步骤S1：获取电力数据资产的原始数据，并随机从中挑选出多组数据转化为文本数据，在去中心化应用程序中将多组数据按照其用途定义分类，并打上标签，制成标签集；步骤S2：构建长短时记忆神经网络，将标签集输入到训练完成的长短时记忆神经网络中，来对标签进行预测，而后将预测的标签与对应数据的标签利用文本对比工具进行文本内容差异对比，选取相似度最高的标签，将去中心化应用程序的标签和关键字的数据组文档与预测的标签组合并，并按照数据集中数据的分布将数据分为训练集与测试集；步骤S3：对训练集与测试集进行文本预处理，并将训练集和测试集以csv表格文本的形式保持下来，并将各种同一种标签的文本进行聚合，将这些属性进行重新编码，之后进行数据归一化处理，消除各个训练集与测试集之间的量纲影响；步骤S4：构建新的神经网络模型，将处理后的训练集与测试集输入进行训练，在经过多次训练后，得到准确率最高的模型，从而得到能够对关键字属性进行挖掘的检索模型，将检索模型搭载入检索引擎中。2.根据权利要求1所述的一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法，其特征在于：所述步骤(S1)中，去中心化应用程序为通过网络节点并通过不同的人来进行去中心化操作的应用。3.根据权利要求1所述的一种基于数据资产智能检索输入输出要求设计特...

【专利技术属性】
技术研发人员：冯珺，彭梁英，王红凯，
申请(专利权)人：国网浙江省电力有限公司信息通信分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人