System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多源数据融合的人物关系图谱的构建与优化方法技术_技高网

基于多源数据融合的人物关系图谱的构建与优化方法技术

技术编号:41287526 阅读:4 留言:0更新日期:2024-05-11 09:36
本发明专利技术提供了一种基于多源数据融合的人物关系图谱的构建与优化方法,步骤包括:实时采集并生成人物基础信息并进行预处理;采用机器学习对预处理后的人物基础信息进行识别与提取,获取人物关系数据;基于人物关系数据构建人物关系图谱;基于实时构建的人物关系数据对人物关系图谱进行优化更新;基于人物关系图谱生成关系分析报告。本发明专利技术提出的方法能够整合多个数据源,提供全面的人物关系信息,增强图谱的准确性和可靠性,根据新的数据源和实时数据动态更新人物关系图谱,保持图谱的时效性和准确性,同时采用图谱分析方法,挖掘人物关系图谱中的关键实体、关系和模式,为企业和个人提供有价值的洞察和建议。

【技术实现步骤摘要】

本专利技术涉及关系图谱相关,具体而言,涉及一种基于多源数据融合的人物关系图谱的构建与优化方法


技术介绍

1、人物关系图谱为人们从海量文本中高效分析、处理和理解人物之间的关系提供了解决方案,在金融、法律、科研等多个行业扮演着越来越重要的角色,为智能问答、决策分析等应用提供可靠的依据,成为了学术界和工业界的研究热点。

2、传统的人物关系图谱构建方案中获取人物信息以及人物关系数据的渠道单一化,由此导致关系图谱的准确性不足,且传统技术中鲜有对人物关系图谱进行实时优化更新的案例,同时对人物关系图谱中的分析往往通过人工进行分析,由此导致效率低下、频繁出错的问题。


技术实现思路

1、鉴于此,本专利技术提出了一种基于多源数据融合的人物关系图谱的构建与优化方法,以解决上述现有技术存在的问题。

2、为实现上述目的,本专利技术提出了一种基于多源数据融合的人物关系图谱的构建与优化方法,包括以下步骤:

3、实时采集并生成人物基础信息;

4、对所述人物基础信息进行预处理;

5、采用机器学习对预处理后的所述人物基础信息进行识别与提取,获取人物关系数据;

6、基于所述人物关系数据构建人物关系图谱;

7、基于实时获取的人物基础信息对所述人物关系图谱进行优化更新;

8、基于所述人物关系图谱生成关系分析报告。

9、可选地,所述人物基础信息包括人物形象图、人物基本信息、人物关系信息,所述人物基本信息包括姓名、性别、出生年月、国籍、出生地、工作履历、职业技能;所述人物关系信息包括家庭成员信息、公司信息、同事关系信息、社交情况信息。

10、可选地,实时采集并生成人物基础信息的过程包括:

11、基于互联网搜索引擎获取公开数据,基于所述公开数据获取人物形象图以及人物基本信息,基于所述人物基本信息中的工作履历获取所述公司信息,基于所述公司信息获取公司内部数据,基于所述公司内部数据获取所述人物关系信息中的家庭成员信息以及同事关系信息,基于社交网络以及相关新闻平台获取所述社交情况信息,基于所述家庭成员信息、公司信息、同事关系信息、社交情况信息生成人物关系信息,并基于所述人物形象图、人物基本信息、人物关系信息生成所述人物基础信息。

12、可选地,对所述人物基础信息进行预处理的过程包括:

13、基于格式转换软件对所述人物基础信息进行文件格式统一,基于数据清洗工具对所述人物基础信息进行多余数据剔除,采用指标计算方法进行缺失数据智能补全,智能识别并修正文字错误以及逻辑错误的数据,采用逻辑验证方法进行关联数据验证。

14、可选地,采用机器学习对预处理后的所述人物基础信息进行识别与提取的过程包括:

15、根据预处理后的所述人物基础信息构建数据集,将所述数据集的20%划分为测试集,80%划分为验证集,采用卷积神经网络构建关系提取模型,基于所述测试集对所述关系提取模型进行识别训练,基于所述验证集对训练完成后的关系提取模型进行识别,输出所述人物关系数据;

16、所述关系提取模型的训练过程包括:基于一维卷积层对所述测试集中的文字进行文本特征提取,获取人物关系特征,通过最大池化操作获取所述人物关系特征中的显著人物特征,并通过全连接层对所述显著人物特征进行分类,对同一特征类别下的人物基础信息构建人物关系,根据不同特征类别下的人物关系构建并输出所述人物关系数据。

17、可选地,所述关系提取模型的训练过程中,构建实际人物关系,计算所述关系提取模型输出的人物关系数据与所述实际人物关系的误差,当存在误差时,基于所述实际人物关系对关系提取模型进行参数优化更新,并采用优化更新后的关系提取模型进行识别,当误差趋于最小值时,获取最佳网络参数,完成所述关系提取模型的训练过程。

18、可选地,基于所述人物关系数据构建人物关系图谱的过程包括:

19、基于所述人物关系数据分别构建第一关系节点以及若干个分层关系节点,并基于所述人物基础信息对所述第一关系节点以及所述分层关系节点分别添加人物信息;

20、将所述人物信息对应的人物形象图添加至所述第一关系节点以及所述分层关系节点中;

21、基于所述人物关系数据构建所述第一关系节点与所述分层关系节点的关系连接线,以及所述分层关系节点之间的关系连接线;

22、基于所述第一关系节点、所述分层关系节点以及所述关系连接线生成所述人物关系图谱。

23、可选地,在所述人物关系图谱构建完成后,若存在未与其他关系节点相连的独立关系节点,则获取所述独立关系节点的人物信息所对应的人物基础信息,并与其他关系节点所对应的人物基础信息进行比对,获取重合文本信息,根据所述重合文本信息判断所述独立关系节点是否属于当前的人物关系图谱中,当存在重合文本信息时,获取重合文本数量最多的其他关系节点,并基于所述人物基础信息构建所述独立关系节点与重合文本数量最多的其他关系节点的关系连接线;当不存在重合文本信息时,则将所述独立关系节点删除。

24、可选地,基于实时获取的人物基础信息对所述人物关系图谱进行优化更新的过程包括:

25、基于社交网络以及相关新闻平台实时获取公司变动信息以及社交变化信息,对所述公司变动信息以及所述社交变化信息进行智能识别,生成实时关系数据,基于所述实时关系数据对所述人物关系图谱中的关系节点进行新增或删除,对所述关系连接线进行实时变更。

26、可选地,基于所述人物关系图谱生成关系分析报告的过程包括:

27、获取所述人物关系图谱中第一关系节点之间的关系连接线数目,基于第一关系节点之间的关系连接线数目生成第一关系报告;

28、构建数量阈值,获取所述人物关系图谱中关系连接线数量超出所述数量阈值的若干个分层关系节点,并根据关系连接线数量对若干个分层关系节点进行排序,基于排序结果生成第二关系报告;

29、基于所述排序结果获取关系连接线数量最多的分层关系节点,并标记为重要关系节点,获取所述重要关系节点与每个第一关系节点之间的关系连接线数量,并生成第三关系报告;

30、基于所述第一关系报告、所述第二关系报告、所述第三关系报告生成关系分析报告。

31、与现有技术相比,本专利技术的有益效果在于:

32、1.本专利技术提出的方法能够整合多个数据源(如社交网络、企业内部数据、公开数据),提供全面的人物关系信息,增强图谱的准确性和可靠性;

33、2.采用先进的数据预处理技术,对采集到的多源数据进行清洗、去重、标准化等操作,保证构建人物关系图谱的数据质量;

34、3.采用机器学习技术自动识别实体(如人物、组织、事件等)及其关系,提高构建人物关系图谱的效率;

35、4.采用知识图谱技术将实体及其关系组织成结构化的人物关系图谱,便于数据存储、查询和分析。

36、5.图谱优化与更新:本专利提出的方法能够根据新的数据源本文档来自技高网...

【技术保护点】

1.一种基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,所述人物基础信息包括人物形象图、人物基本信息、人物关系信息,所述人物基本信息包括姓名、性别、出生年月、国籍、出生地、工作履历、职业技能;所述人物关系信息包括家庭成员信息、公司信息、同事关系信息、社交情况信息。

3.根据权利要求2所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,实时采集并生成人物基础信息的过程包括:

4.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,对所述人物基础信息进行预处理的过程包括:

5.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,采用机器学习对预处理后的所述人物基础信息进行识别与提取的过程包括:

6.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,所述关系提取模型的训练过程中,构建实际人物关系,计算所述关系提取模型输出的人物关系数据与所述实际人物关系的误差,当存在误差时,基于所述实际人物关系对关系提取模型进行参数优化更新,并采用优化更新后的关系提取模型进行识别,当误差趋于最小值时,获取最佳网络参数,完成所述关系提取模型的训练过程。

7.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,基于所述人物关系数据构建人物关系图谱的过程包括:

8.根据权利要求7所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,在所述人物关系图谱构建完成后,若存在未与其他关系节点相连的独立关系节点,则获取所述独立关系节点的人物信息所对应的人物基础信息,并与其他关系节点所对应的人物基础信息进行比对,获取重合文本信息,根据所述重合文本信息判断所述独立关系节点是否属于当前的人物关系图谱中,当存在重合文本信息时,获取重合文本数量最多的其他关系节点,并基于所述人物基础信息构建所述独立关系节点与重合文本数量最多的其他关系节点的关系连接线;当不存在重合文本信息时,则将所述独立关系节点删除。

9.根据权利要求7所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,基于实时获取的人物基础信息对所述人物关系图谱进行优化更新的过程包括:

10.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,基于所述人物关系图谱生成关系分析报告的过程包括:

...

【技术特征摘要】

1.一种基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,所述人物基础信息包括人物形象图、人物基本信息、人物关系信息,所述人物基本信息包括姓名、性别、出生年月、国籍、出生地、工作履历、职业技能;所述人物关系信息包括家庭成员信息、公司信息、同事关系信息、社交情况信息。

3.根据权利要求2所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,实时采集并生成人物基础信息的过程包括:

4.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,对所述人物基础信息进行预处理的过程包括:

5.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,采用机器学习对预处理后的所述人物基础信息进行识别与提取的过程包括:

6.根据权利要求1所述的基于多源数据融合的人物关系图谱的构建与优化方法,其特征在于,所述关系提取模型的训练过程中,构建实际人物关系,计算所述关系提取模型输出的人物关系数据与所述实际人物关系的误差,当存在误差时,基于所述实际人物关系对关系提取模型进行参数优化更新,并采用优化更...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:共济润道人工智能科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1