一种电力设备资产管理数据所属类别和组的推荐方法技术

技术编号:39331870 阅读:8 留言:0更新日期:2023-11-12 16:07
本发明专利技术提供了一种电力设备资产管理数据所属类别和组的推荐方法,包括:利用自然语言技术对电力资产管理系统的文本数据进行处理,得到有效文本数据;对有效文本数据进行实体处理,并在基于实体结果构建知识图谱;根据知识图谱的拓扑结构信息,计算知识图谱节点的影响力;提取用户输入资产信息的标准实体,并从知识图谱中提取与标准实体匹配的子图谱;根据匹配的子图谱的主题概率分布和节点影响力,得到推荐的资产类别和资产组。本发明专利技术解决了现有针对电力资产数据管理平台的推荐方法存在推荐准确度不高的问题。准确度不高的问题。准确度不高的问题。

【技术实现步骤摘要】
一种电力设备资产管理数据所属类别和组的推荐方法


[0001]本专利技术涉及数据处理系统
,具体而言,涉及一种电力设备资产管理数据所属类别和组的推荐方法。

技术介绍

[0002]在不断完善的互联网技术服务里,各种各样的资源平台系统能够从用户所提供的多种数据中提取信息,并结合数据各方面特点进而自动推荐出相关内容,因此基于内容的推荐技术也推动了互联网的进步。资源平台系统中的推荐模型通常会根据用户自身提供的数据和数据库的资源内容作为判断依据,通过相似度的计算来实现推荐,但在此过程中,推荐结果会受到数据资源内容丰富程度的影响,同时如何去训练出高精确度的推荐模型也面临困难。如今计算机技术已进入发展迅速的信息时代,用户能够从海量的数据资源平台系统中获得所需的各种信息,因此平台系统为用户带来了信息获取的便捷与完整,例如,用户能够从平台里迅速获取到意向购买的物品。这样的资源平台系统为用户从海量的数据内容中获取信息带来了自动化、智能化的方便,因此数据资源平台系统需要不断提升并优化这样的数据推荐方法。在庞大的互联网中信息资源仍以指数的形式持续增长,为用户如何在取之不尽的信息资源中挖掘出所需的关键内容迎来了挑战。
[0003]根据目前的发展形势,多种互联网平台为优化资源数据内容的自动推荐做出竞争和创新。但是往往无法获得较高准确率的推荐结果,尤其在电力领域的电力资产数据管理平台上,部分推荐方法将文本数据之间的相互影响程度作为推荐依据的较少,同时类型定义、关系定义标准不明确。因此,针对用户提供的数据信息实现待推荐文本数据的自动推荐差异较大的问题,需要进行不断的技术迭代与探索。

技术实现思路

[0004]针对现有技术中的上述不足,本专利技术提供的一种电力设备资产管理数据所属类别和组的推荐方法解决了现有针对电力资产数据管理平台的推荐方法存在推荐准确度不高的问题。
[0005]为了达到上述专利技术目的,本专利技术采用的技术方案为:一种电力设备资产管理数据所属类别和组的推荐方法,包括:
[0006]利用自然语言技术对电力资产管理系统的文本数据进行处理,得到有效文本数据;
[0007]对有效文本数据进行实体处理,并基于实体结果构建知识图谱;
[0008]根据知识图谱的拓扑结构信息,计算知识图谱节点的影响力;
[0009]提取用户输入资产信息的标准实体,并从知识图谱中提取与标准实体匹配的子图谱。
[0010]根据匹配的子图谱的主题的概率分布和节点影响力,得到推荐的资产类别和资产组;
[0011]进一步地,所述自然语言处理包括:分词、关键词抽取、语义抽取和去停用词;
[0012]所述实体处理包括:实体识别和实体对齐。
[0013]进一步地,所述计算知识图谱节点的影响力包括:
[0014]从知识图谱提取节点与节点之间的关系,构建有向图;
[0015]根据有向图,计算节点全局影响力;
[0016]对全局影响力归一化处理,得到归一化的全局影响力。
[0017]进一步地,所述计算节点全局影响力采用一阶马尔可夫链模型。
[0018]进一步地,采用实体抽取网络模型提取用户输入资产信息的标准实体,其中,实体抽取网络模型包括:输入层、词嵌入层、卷积注意力层、GRU层、全局注意力层、CRF层和输出层;所述词嵌入层的输入端与输入层连接,其输出端与卷积注意力层的输入端连接;所述GRU层的输入端与卷积注意力层的输出端连接,其输出端与全局注意力层的输入端连接;所述CRF层的输入端与全局注意力层的输出端连接,其输出端与输出层连接。
[0019]进一步地,所述从知识图谱中提取与标准实体匹配的子图谱包括:
[0020]计算用户的标准实体与知识图谱上节点信息的相似度;
[0021]将相似度高于相似度阈值的节点构建为与标准实体匹配的子图谱。
[0022]进一步地,所述相似度的计算公式为:
[0023][0024]其中,sim
information
(M
A
,M
B
)为相似度,M
A
为用户的标准实体,M
B
为知识图谱上节点信息,|M
A
|和|M
B
|为各自向量的取模运算,
·
为点乘。
[0025]进一步地,所述根据匹配的子图谱的主题的概率分布和节点影响力,得到推荐的资产类别和资产组包括:
[0026]提取匹配的子图谱中知识图谱节点影响力;
[0027]用户输入语句利用LDA模型进行主题计算,统计该语句所属资产类别和资产组的每个主题的概率分布;
[0028]根据每个主题的概率分布与节点影响力,计算节点推荐值;
[0029]根据节点推荐值,选取最大的节点推荐值对应的节点,作为推荐的资产类别和资产组。
[0030]本专利技术实施例的技术方案至少具有如下优点和有益效果:本专利技术公开了一种电力设备资产管理数据相似计算的推荐方法,通过自然语言处理,解决了自动推荐结果不准确的问题。在引入节点影响力的计算下保证了电力资产数据推荐的鲁棒性,同时结合主题计算还可以使推荐过程更加灵活且有针对性,降低了错误信息的输出。最后该方法能够在多种领域的资产管理系统场景中应用,给企业提升管理水平提供了坚实的技术基础,极大的提高资产管理水平,实现信息的共享,提高工作效率,提供决策依据。
附图说明
[0031]图1为一种电力设备资产管理数据所属类别和组的推荐方法的流程图;
[0032]图2为本实施例的一种电力设备资产管理数据所属类别和组的推荐方法的详细流程图;
[0033]图3为电力资产标准知识模式构建图;
[0034]图4为知识图谱部分实体关系结构示意图;
[0035]图5为实体抽取网络模型的结构示意图。
具体实施方式
[0036]为使本专利技术实施例的目的技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0037]如图1~2所示,一种电力设备资产管理数据所属类别和组的推荐方法,包括以下步骤:
[0038]S1、利用自然语言技术对电力资产管理系统的文本数据进行处理,得到有效文本数据;
[0039]在本实施例中,通过将电力内部资产管理系统的半结构化数据信息进行提取,按照资产类别、资产组和资产名称的数据结构模式将文本数据依次分为三种层级。三种层级分别为所属关系,同时资产类别对应于第一层级,资产组对应于第二层级,资产名称对应于第三层级。
[0040]对文本数据利用自然语言处理的一些技术,将三种类别的数据分别进行分词、去除停用词、关键词抽取、语义抽取操作,经过这些操作后的数据形成有效电力资产管理系统文本数据。
[0041]S2、对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力设备资产管理数据所属类别和组的推荐方法,其特征在于,包括:利用自然语言技术对电力资产管理系统的文本数据进行处理,得到有效文本数据;对有效文本数据进行实体处理,并基于实体结果构建知识图谱;根据知识图谱的拓扑结构信息,计算知识图谱节点的影响力;提取用户输入资产信息的标准实体,并从知识图谱中提取与标准实体匹配的子图谱;根据匹配的子图谱的主题的概率分布和节点影响力,得到推荐的资产类别和资产组。2.根据权利要求1所述的电力设备资产管理数据所属类别和组的推荐方法,其特征在于,所述自然语言处理包括:分词、关键词抽取、语义抽取和去停用词;所述实体处理包括:实体识别和实体对齐。3.根据权利要求1所述的电力设备资产管理数据所属类别和组的推荐方法,其特征在于,所述计算知识图谱节点的影响力包括:从知识图谱提取节点与节点之间的关系,构建有向图;根据有向图,计算节点全局影响力;对全局影响力归一化处理,得到归一化的全局影响力。4.根据权利要求3所述的电力设备资产管理数据所属类别和组的推荐方法,其特征在于,所述计算节点全局影响力采用一阶马尔可夫链模型。5.根据权利要求1所述的电力设备资产管理数据所属类别和组的推荐方法,其特征在于,采用实体抽取网络模型提取用户输入资产信息的标准实体,其中,实体抽取网络模型包括:输入层、词嵌入层、卷积注意力层、GRU层、全局注意力层、CRF层和输出层;所述词嵌入层的输入端与输入层连接,其输出端与卷积注意力层的输入端连接;所述GRU层的输入端与卷积注意力层...

【专利技术属性】
技术研发人员:熊开智朱华林罗戎岳攀蔡炜高峻
申请(专利权)人:雅砻江流域水电开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1