一种基于模式匹配的实体并列关系相似度计算方法技术

技术编号:23315205 阅读:106 留言:0更新日期:2020-02-11 17:50
一种基于模式匹配的实体并列关系相似度计算方法,包括以下具体步骤:构建知识图谱A和数据库B;输入模式匹配成功的初始数据C;将初始数据C输入知识图谱A中,对得到实体片段信息组D进行聚类,并根据得到第一聚类实体信息E建立第一共词网络F;在数据库中检索包括实体片段信息组D的语料,并将得到语料组G输入知识图谱A中,得到语料组G所包括的实体信息H;将得到的实体信息H进行聚类,并根据得到第二聚类实体信息I建立语料组G对应的第二共词网络J;计算第一共词网络F和第二共词网络J之间的相似度。本发明专利技术能缩短使用者从数据库中获取使用者所需信息的检索时间,进而提高了工作效率。

A similarity calculation method of entity juxtaposition based on pattern matching

【技术实现步骤摘要】
一种基于模式匹配的实体并列关系相似度计算方法
本专利技术涉及数据处理
,尤其涉及一种基于模式匹配的实体并列关系相似度计算方法。
技术介绍
实体相似度的计算有诸多应用,相似度模型的典型应用场景就是找到和某个实体相似的其他实体。随着信息网络技术的发展,网络上的信息呈指数增长,当需要对相关主题的信息进行统计时,由于网络上统计出的数据信息无法估计,只是依靠人力管理势必会浪费诸多的人力资源,且需要耗费大量的时间才能得到所需的相关信息,往往还会出现偏差;为此,本申请提出一种基于模式匹配的实体并列关系相似度计算方法。
技术实现思路
(一)专利技术目的为解决
技术介绍
中存在的技术问题,本专利技术提出一种基于模式匹配的实体并列关系相似度计算方法,本专利技术能缩短使用者从数据库中获取使用者所需信息的检索时间,进而提高了工作效率。(二)技术方案为解决上述问题,本专利技术提供了一种基于模式匹配的实体并列关系相似度计算方法,包括以下具体步骤:S1、构建知识图谱A和数据库B;S2、输入模式匹配成功的初始数据C本文档来自技高网...

【技术保护点】
1.一种基于模式匹配的实体并列关系相似度计算方法,其特征在于,包括以下具体步骤:/nS1、构建知识图谱A和数据库B;/nS2、输入模式匹配成功的初始数据C;/nS3、将初始数据C输入知识图谱A中,得到实体片段信息组D;/nS4、将得到的实体片段信息组D进行聚类,得到第一聚类实体信息E;/nS5、根据第一聚类实体信息E建立初始数据A对应的第一共词网络F;/nS6、在数据库中检索包括实体片段信息组D的语料,得到语料组G;/nS7、将语料组G输入知识图谱A中,得到语料组G所包括的实体信息H;/nS8、将得到的实体信息H进行聚类,得到第二聚类实体信息I;/nS9、根据第二聚类实体信息I建立语料组G对应...

【技术特征摘要】
1.一种基于模式匹配的实体并列关系相似度计算方法,其特征在于,包括以下具体步骤:
S1、构建知识图谱A和数据库B;
S2、输入模式匹配成功的初始数据C;
S3、将初始数据C输入知识图谱A中,得到实体片段信息组D;
S4、将得到的实体片段信息组D进行聚类,得到第一聚类实体信息E;
S5、根据第一聚类实体信息E建立初始数据A对应的第一共词网络F;
S6、在数据库中检索包括实体片段信息组D的语料,得到语料组G;
S7、将语料组G输入知识图谱A中,得到语料组G所包括的实体信息H;
S8、将得到的实体信息H进行聚类,得到第二聚类实体信息I;
S9、根据第二聚类实体信息I建立语料组G对应的第二共词网络J;
S10、计算第一共词网络F和第二共词网络J之间的相似度。


2.根据权利要求1所述的一种基于模式匹配的实体并列关系相似度计算方法,其特征在于,初始数据C包括结构化数据、非结构化的数据和半结构化的数据。


3.根据权利要求1所述的一种基于模式匹配的实体并列关系相似度计算方法,其特征在于,S3中对初始数据C输入...

【专利技术属性】
技术研发人员:刘家祥
申请(专利权)人:厦门美域中央信息科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1