The invention discloses a domain knowledge map and a query method based on a semantic triangle. The invention of the map including concept layer and entity layer; the concept layer is composed of a collection of concepts, each concept with unique identifier, and represented by a lexical entry and candidate lexical entry sets; according to the domain concept knowledge and concept layer set, multiple entities corresponding to instantiate each concept, constitute the physical layer, the entity is the extension of a concept, a unique identifier for each entity, and represented by a lexical entry and candidate lexical entry sets; related to establish related knowledge according to the field set between the related concepts; concept layer and entity layer is provided with a relationship established according to relevant knowledge of related fields; according to the related field the construction of knowledge set between entities. The method realizes the separation of concepts and entities, facilitates the carding of knowledge, and distinguishes the different roles of concepts and entities in the understanding and application of knowledge, thus improving the query efficiency.
【技术实现步骤摘要】
一种基于语义三角的领域知识图谱及查询方法
本专利技术属于人工智能领域,具体涉及一种基于语义三角的领域知识图谱及查询方法。
技术介绍
随着互联网技术的飞速发展,人类先后经历了以文档为主要特征的“Web1.0”时代和以数据互联数据共享为特征的“Web2.0”时代,并且正在走向基于知识互联的“Web3.0”时代。在大数据中表示一个可理解的知识网络,成为现代互联网时代的一大挑战。同样,人机交互的基础在于理解用户的言语信息、推断用户的意图进而由机器返回给用户结果。知识图谱以其强大的语义处理能力与开放互联的能力应运而生,能够将互联网中的海量、异构的数据聚集为可理解的知识网络,便于理解、应用。因此,如何表示某个特定领域的知识图谱并应用于特定的业务场景以解决相应的问题,具有十分重要的意义。现有的知识图谱的表示大多描述的是实体之间的语义网络,每个实体(概念的外延)用一个全局唯一确定的ID来标识,采用主-谓-宾三元组的形式表示知识网络。但是这种表示方法会带来概念和实体的混淆,从而造成用户的理解障碍,并且不利于实体的理解。针对特定的问题,需要在存在海量数据和关系的知识图谱中查询,成本相对较高。传统的知识图谱还存在一词多义和一义多词的问题,使得语义网络混乱,不利于从互联网丰富的词语中整理出知识并进行快速查询。语义三角是一种关于意义的理论,由英国学者奥格登(Ogden)和理查兹(Richards)在1923年出版的语义学重要著作《意义的意义》(TheMeaningofMeaning)中提出,代表了传统语义学的典型观点。描述的是符号、概念(意义)和客观事物之间的一种相互制约、相互作用 ...
【技术保护点】
一种基于语义三角的领域知识图谱,其特征在于,包括概念层、实体层;其中,所述概念层为一与目标领域知识相关的概念集合,每一概念设有唯一的标识,并用一代表词项和一候选词项集合表示;所述概念对应语义三角中的概念或意义,概念i的所述候选词项集合中的每个候选词为该概念i的代表词项的同义词或近义词,概念i对应的每一候选词设置一代表概念i的概率值;所述实体层为一实体集合,根据目标领域相关的知识对所述概念集合中每个概念进行实例化得到每一概念对应的多个实体,构成所述实体集合;每一实体设有唯一的标识,并用一代表词项和一候选词项集合;实体i的所述候选词项集合中的每个候选词为该实体i的代表词项的同义词,实体i对应的每一候选词设置一代表实体i的概率值;所述概念层的相关概念之间设置有根据领域相关知识建立的关联关系;概念层与实体层之间设置有根据领域相关知识建立的关联关系;所述实体之间设置有根据领域相关知识构建的关联关系。
【技术特征摘要】
1.一种基于语义三角的领域知识图谱,其特征在于,包括概念层、实体层;其中,所述概念层为一与目标领域知识相关的概念集合,每一概念设有唯一的标识,并用一代表词项和一候选词项集合表示;所述概念对应语义三角中的概念或意义,概念i的所述候选词项集合中的每个候选词为该概念i的代表词项的同义词或近义词,概念i对应的每一候选词设置一代表概念i的概率值;所述实体层为一实体集合,根据目标领域相关的知识对所述概念集合中每个概念进行实例化得到每一概念对应的多个实体,构成所述实体集合;每一实体设有唯一的标识,并用一代表词项和一候选词项集合;实体i的所述候选词项集合中的每个候选词为该实体i的代表词项的同义词,实体i对应的每一候选词设置一代表实体i的概率值;所述概念层的相关概念之间设置有根据领域相关知识建立的关联关系;概念层与实体层之间设置有根据领域相关知识建立的关联关系;所述实体之间设置有根据领域相关知识构建的关联关系。2.如权利要求1所述的领域知识图谱,其特征在于,所述相关概念之间的关联关系包括:a)包含关系,若概念及其属性均在所述概念集合中,则概念与其属性之间为包含关系;b)隶属关系,若一个概念是另外一个概念涵义的子集,则两者之间的关系即为隶属关系。3.如权利要求1所述的领域知识图谱,其特征在于,所述概念与所述实体之间、所述概念与所述概念的表示之间是紧密耦合关系,所述实体与所述实体的表示之间是松散耦合关系。4.如权利要求1或2或3所述的领域知识图谱,其特征在于,所述概念层根据不同的业务场景分为若干概念子层,每一概念子层对应一概念子集。5...
【专利技术属性】
技术研发人员:王宏安,李依霖,朱嘉奇,刘胜航,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。