一种基于形式概念分析技术的增量式实体摘要方法技术

技术编号：23852221 阅读：33 留言：0更新日期：2020-04-18 09:14

一种基于形式概念分析技术的增量式实体摘要生成方法，包括如下步骤：S100：分别构造初始知识图谱RDF数据的初始形式背景k

An incremental entity summarization method based on formal concept analysis

全部详细技术资料下载

【技术实现步骤摘要】
一种基于形式概念分析技术的增量式实体摘要方法
本公开属于人工智能、数据挖掘、互联网
，具体涉及一种基于形式概念分析技术的增量式实体摘要生成方法。
技术介绍
目前，随着语义网的蓬勃发展，互联网中积累了越来越多的以非结构化形式存储的信息。然而，由于计算机擅于处理结构化数据，为了让计算机能够处理这些非结构化形式存储的信息，将其用知识图谱的形式进行存储，可以很好的理解和应用这些非结构化数据的语义和关系。因此，知识图谱，作为新一代人工智能的基础设施之一，得到了学术界和工业界广泛的关注。知识图谱，是结构化的语义知识库，用“实体-关系-实体”三元组、实体和其相关的“属性-值”对的形式，来描述物理世界中的概念及其相互关系，实体间通过关系相互联结，构成网状的知识结构。知识图谱中的实体可以用资源描述框架(ResourceDescriptionFramework)来进行统一描述，具体地，是由多个“主语-谓语-宾语”形式的三元组进行表示。然而，在当今互联网、物联网、云计算等技术不断发展的背景下，用户产生了海量的数据，且在不断增加。因此，用户在浏览不断增长的大量知识图谱信息的同时，不可避免地会陷入信息过载的境地。例如，最近版本的知识图谱DBpedia就包含了17亿的RDF三元组、660万实体，相当于平均每个实体包含258个描述信息。因此，有必要为用户提供一个简洁的实体摘要信息，从而能够有效避免用户陷入信息过载。实体摘要技术，旨在从大量冗长的知识图谱数据中，为用户提取出简洁而又具有代表性的信息。其实质是对“属性-值”对进行...

【技术保护点】
1.一种基于形式概念分析技术的增量式实体摘要生成方法，包括如下步骤：/nS100：分别构造初始知识图谱RDF数据的初始形式背景k

【技术特征摘要】
1.一种基于形式概念分析技术的增量式实体摘要生成方法，包括如下步骤：
S100：分别构造初始知识图谱RDF数据的初始形式背景k1及新增知识图谱RDF数据的新增形式背景k2；
S200：分别构造初始形式背景k1的概念格C1及新增形式背景k2的概念格C2；
S300：对概念格C1的外延和概念格C2的外延求交集，得到集合T；
S400：由集合T中的外延元素，得到对应的内涵，构成最终的概念格；
S500：基于所形成的最终的概念格，利用排序算法，得到实体摘要。

2.根据权利要求1所述的方法，其中，优选的，所述步骤S100进一步包括如下子步骤：
S101：将知识图谱RDF中的三元组的“谓语”和“宾语”分别作为形式概念分析技术中形式背景的“属性”和“对象”；
S102：将“对象”按照一定规则分割后，找出所有的其与“属性”的关联关系；
S103：按照子步骤S101的方式，将初始知识图谱RDF三元组和新增知识图谱RDF三元组，根据子步骤S102得到的“属性”和“对象”的关联关系，分别构造初始形式背景k1和新增形式背...

【专利技术属性】
技术研发人员：郝飞，杨二贺，高杰，张立臣，李黎，王小明，
申请(专利权)人：陕西师范大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人