System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 企业数字化运营多维数据分析方法及系统技术方案_技高网

企业数字化运营多维数据分析方法及系统技术方案

技术编号:40486771 阅读:4 留言:0更新日期:2024-02-26 19:18
本发明专利技术公开了企业数字化运营多维数据分析方法及系统,涉及企业知识图谱构建技术领域,通过定义核心本体数据,并基于核心本体数据,对实例化文本数据进行实体抽取,基于实例化文本数据,对实体实例数据集合进行关系抽取,获得实体关系实例数据集合,基于实体实例数据集合和实体关系实例数据集合,为每个功能模块生成局部知识图谱实例,基于所有功能模块的知识图谱实例,使用关联规则挖掘算法,分析各个局部知识图谱实例之间的关联关系,生成全局知识图谱实例;挖掘不同功能模块数据之间的关联关系,实现多源数据有效融合利用。

【技术实现步骤摘要】

本专利技术涉及企业知识图谱构建,具体是企业数字化运营多维数据分析方法及系统


技术介绍

1、随着企业数字化转型的不断推进,企业内部形成了庞大的数据资产,这些数据资产具有多源异构、质量参差不齐等特征。如何充分利用这些数据资产,支持企业多维度业务分析,是企业数字化建设面临的重要课题。

2、现有企业运营数据分析存在以下问题:

3、目前企业内部数据资产信息孤岛严重,来源系统种类繁多,各功能模块的数据之间存在依赖关系,但关系表达不明确,导致多源数据融合难度大;

4、分析结果无法直观呈现,不支持多维交叉分析,用户体验差;

5、授权公告号为cn116028652b的中国专利,提供一种基于工业企业数据的知识图谱构建方法及装置,包括:依据应用于工业企业的数据指标所属的指标类型,对数据指标进行分析以确定构建数据指标的原始指标;构建指标本体、指标属性本体、维度本体之间的关系,得到第一关系结构图;依据指标元数据,构建etl本体、etl属性本体、etl本体与指标本体之间的关系,得到第二关系结构图;针对任一本体对,本体对包含存在路径的两个本体,确定该本体对的三元组信息;依据各本体对的三元组信息构建知识图谱;然而该方法未能解决各个模块本体之间存在的依赖关系,从而难以建立全局的知识图谱;

6、为此,本专利技术提出企业数字化运营多维数据分析方法及系统。


技术实现思路

1、本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出企业数字化运营多维数据分析方法及系统,构建企业知识图谱,挖掘不同功能模块数据之间的关联关系,实现多源数据有效融合利用。

2、为实现上述目的,根据本专利技术的实施例1提出企业数字化运营多维数据分析方法,包括以下步骤:

3、收集管理平台的功能模块数据,基于功能模块数据,定义核心本体数据;

4、收集各个功能模块的实例化文本数据,并基于核心本体数据,对实例化文本数据进行实体抽取,获得实体实例数据集合;

5、基于实例化文本数据,对实体实例数据集合进行关系抽取,获得实体关系实例数据集合;

6、基于实体实例数据集合和实体关系实例数据集合,为每个功能模块生成局部知识图谱实例;

7、基于所有功能模块的知识图谱实例,使用关联规则挖掘算法,分析各个局部知识图谱实例之间的关联关系,生成全局知识图谱实例;

8、所述收集管理平台的功能模块数据的方式为:

9、收集企业内部运营的管理平台中所包含的各个单元模块,以及每个单元模块包含的功能模块集合;所有功能模块集合组成功能模块数据;

10、所述基于功能模块数据,定义核心本体数据的方式为:

11、基于各个不同的功能模块的实际功能,根据本领域专业知识,为每个功能模块定义一项核心本体,以及核心本体对应的若干实体和若干关系;每个功能模块的核心本体以及核心本体对应的若干实体和若干关系组成一组核心本体单元,所有核心本体单元组成核心本体数据;

12、所述收集各个功能模块的实例化文本数据的方式为:

13、对于每个功能模块,收集该功能模块运营过程中经用户上传或按程序代码生成的文本文件,将所有文本文件中的文本作为该功能模块的实例化文本数据;

14、所述基于核心本体数据,对实例化文本数据进行实体抽取,获得实体实例数据集合,包括:

15、对于每个功能模块,基于实例化文本数据中,各个文本对应的文件名命名规则,将文本按不同的实例名称进行归类,生成每个实例名称对应的实例文本集合;其中,所述实例名称对应于该功能模块的核心本体;

16、对于每个实例名称的实例文本集合,使用ner技术对每个文件文本进行实体抽取,获得该实例名称对应的核心本体的所有实体实例集合;所有实例名称对应的实体实例集合组成实体实例数据集合;

17、所述基于实例化文本数据,对实体实例数据集合进行关系抽取,获得实体关系实例数据集合,包括:

18、预训练bert模型;

19、使用实例化文本数据对预训练后的bert模型进行微调;

20、收集关系分类样本数据,并对关系分类样本数据中的文本进行实体与核心本体之间的关系标注;

21、关系分类样本数据输入至微调后的bert模型,获得语句词向量集合;以语句词向量集合为输入,以关系标注作为输出,训练关系分类模型;

22、对于每个实例名称的实体实例集合:

23、筛选出每个实体实例抽取时对应的文件文本,将筛选的文件文本输入至微调后的bert模型中,获得实例语句词向量,将实例语句词向量输入至关系分类模型,获得输出的对核心本体与实体实例之间的关系的预测结果;

24、对于每个实例名称,对应的核心本体与各个实体实例之间的关系的预测结果组成一组局部关系项集实例;所有局部关系项集实例组成实体关系实例数据集合;

25、所述基于实体实例数据集合和实体关系实例数据集合,为每个功能模块生成局部知识图谱实例包括:

26、对于每个实例名称,以实例名称和实体实例集合中的每个元素为局部知识图谱实例的实体节点,以实例名称对应的局部关系项集实例中的每个关系作为对应的实体节点之间的边,为每个实例名称构建出一个知识图谱实例;每个功能模块的所有实例名称对应的知识图谱实例组成局部知识图谱实例;

27、所述基于所有功能模块的知识图谱实例,使用关联规则挖掘算法,分析各个局部知识图谱实例之间的关联关系,生成全局知识图谱实例,包括:

28、对于任意两个功能模块:

29、将每个功能模块对应的局部知识图谱实例中的每个知识图谱实例转为项集形式;其中每个项集代表一个知识图谱实例的属性集合;

30、将项集中的属性值进行编码,以适应关联规则挖掘算法的要求;

31、选择关联规则挖掘算法来寻找核心本体之间的关联关系;

32、定义支持度阈值和置信度阈值;

33、使用选择的关联规则挖掘算法、支持度阈值和置信度阈值,进行关联规则挖掘,生成频繁项集,描述每两个项集之间的关联;

34、根据两个功能模块的频繁项集,将对应的局部知识图谱实例中,各个知识图谱实例中的核心本体对应的实体节点进行连接;

35、将所有核心本体连接后的知识图谱作为全局知识图谱实例。

36、根据本专利技术的实施例2提出企业数字化运营多维数据分析系统,包括功能模块数据收集模块、实例抽取模块以及知识图谱实例生成模块;其中,各个模块之间通过电性连接;

37、功能模块数据收集模块,用于收集管理平台的功能模块数据,基于功能模块数据,定义核心本体数据,并将核心本体数据发送至实例抽取模块;

38、实例抽取模块,用于收集各个功能模块的实例化文本数据,并基于核心本体数据,对实例化文本数据进行实体抽取,获得实体实例数据集合,基于实例化文本数据,对实体实例数据集合进行关系抽取,获得实体关本文档来自技高网...

【技术保护点】

1.企业数字化运营多维数据分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的企业数字化运营多维数据分析方法,其特征在于,所述收集管理平台的功能模块数据的方式为:

3.根据权利要求2所述的企业数字化运营多维数据分析方法,其特征在于,所述基于功能模块数据,定义核心本体数据的方式为:

4.根据权利要求3所述的企业数字化运营多维数据分析方法,其特征在于,所述收集各个功能模块的实例化文本数据的方式为:

5.根据权利要求4所述的企业数字化运营多维数据分析方法,其特征在于,所述基于核心本体数据,对实例化文本数据进行实体抽取,获得实体实例数据集合,包括:

6.根据权利要求5所述的企业数字化运营多维数据分析方法,其特征在于,所述基于实例化文本数据,对实体实例数据集合进行关系抽取,获得实体关系实例数据集合,包括:

7.根据权利要求6所述的企业数字化运营多维数据分析方法,其特征在于,对于每个实例名称的实体实例集合,获得一组局部关系项集实例的方式为:

8.根据权利要求7所述的企业数字化运营多维数据分析方法,其特征在于,所述基于实体实例数据集合和实体关系实例数据集合,为每个功能模块生成局部知识图谱实例,包括:

9.根据权利要求8所述的企业数字化运营多维数据分析方法,其特征在于,所述基于所有功能模块的知识图谱实例,使用关联规则挖掘算法,分析各个局部知识图谱实例之间的关联关系,生成全局知识图谱实例,包括:

10.企业数字化运营多维数据分析系统,其基于权利要求1-9中任意一项所述的企业数字化运营多维数据分析方法实现,其特征在于,包括功能模块数据收集模块、实例抽取模块以及知识图谱实例生成模块;其中,各个模块之间通过电性连接;

11.一种电子设备,其特征在于,包括:处理器和存储器,其中,

12.一种计算机可读存储介质,其特征在于,其上存储有可擦写的计算机程序;

...

【技术特征摘要】

1.企业数字化运营多维数据分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的企业数字化运营多维数据分析方法,其特征在于,所述收集管理平台的功能模块数据的方式为:

3.根据权利要求2所述的企业数字化运营多维数据分析方法,其特征在于,所述基于功能模块数据,定义核心本体数据的方式为:

4.根据权利要求3所述的企业数字化运营多维数据分析方法,其特征在于,所述收集各个功能模块的实例化文本数据的方式为:

5.根据权利要求4所述的企业数字化运营多维数据分析方法,其特征在于,所述基于核心本体数据,对实例化文本数据进行实体抽取,获得实体实例数据集合,包括:

6.根据权利要求5所述的企业数字化运营多维数据分析方法,其特征在于,所述基于实例化文本数据,对实体实例数据集合进行关系抽取,获得实体关系实例数据集合,包括:

7.根据权利要求6所述的企业数字化运营多维数据分析方法,其特...

【专利技术属性】
技术研发人员:唐自强李少强韩超殷晨明田祥雨范舟孙科孔硕颖陈扬虞凌云
申请(专利权)人:国网江苏省电力工程咨询有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1