This disclosure provides a method for establishing a domain specific connection segment graph. The method may include: collecting entity data from a source associated with the domain to form an entity data set for the domain; processing the entity data set; and using the processed entity data set to establish the connection fragmentation map, wherein the establishment includes utilizing the inclusion of multiple collars. The knowledge map of domain knowledge enriches the linked subsection atlas.
【技术实现步骤摘要】
【国外来华专利技术】建立和更新连接分段图谱
技术介绍
知识图谱是用于利用从宽泛的多种源收集的语义-搜索信息来增强搜索引擎的搜索结果的知识库。传统的知识图谱是包含与来自多种领域的各种类型的实体有关的知识的单一图谱。单一知识图谱的问题在于难以控制知识图谱的质量,尤其是针对维持高精度的图谱更是如此。
技术实现思路
提供了该
技术实现思路
以用简化的形式引入了对在下文的具体实施方式中所进一步描述的概念的选择。该
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。在一个方面中,本公开提供了一种用于建立特定于领域的连接分段图谱(CSG)的方法。所述方法可以包括:从与所述领域相关联的源收集实体数据,以形成针对所述域的实体数据集。所述方法还可以包括:经由清理、去重、和映射过程来处理所述实体数据集。所述方法还可以包括:利用经处理的实体数据集来建立所述连接分段图谱。所述建立可以包括利用包含关于多个领域的知识的知识图谱来丰富所述连接分段图谱。在另一个方面中,本公开提供了一种用于建立特定于领域的连接分段图谱(CSG)的装置。所述装置可以包括:收集模块,其被配置为从与所述领域 ...
【技术保护点】
1.一种用于建立特定于领域的连接分段图谱的方法,所述方法包括:从与所述领域相关联的源收集实体数据,以形成针对所述领域的实体数据集;对所述实体数据集进行处理;以及利用经处理的实体数据集来建立所述连接分段图谱,其中,所述建立包括利用包含关于多个领域的知识的知识图谱来丰富所述连接分段图谱。
【技术特征摘要】
【国外来华专利技术】1.一种用于建立特定于领域的连接分段图谱的方法,所述方法包括:从与所述领域相关联的源收集实体数据,以形成针对所述领域的实体数据集;对所述实体数据集进行处理;以及利用经处理的实体数据集来建立所述连接分段图谱,其中,所述建立包括利用包含关于多个领域的知识的知识图谱来丰富所述连接分段图谱。2.根据权利要求1所述的方法,还包括:如果所述连接分段图谱满足预先定义的标准,则利用来自所述连接分段图谱的实体数据来更新所述知识图谱。3.根据权利要求1所述的方法,其中,所述收集包括:从所述源取回信息;从所取回的信息中提取实体数据;以及存储所述实体数据。4.根据权利要求1所述的方法,其中,所述处理包括以下项中的至少一项:清理所述实体数据集以移除噪声,对所述实体数据集进行去重,将所述实体数据集中的实体数据规范化,以及将所述实体数据集中的实体数据映射至特定于所述连接分段图谱的模式。5.根据权利要求1所述的方法,其中,所述建立还包括:对所述实体数据集执行实体匹配;以及基于与所述连接分段图谱相关联的预先定义的组合规则来组合所述实体数据集中的两个或更多个实体数据项。6.根据权利要求1所述的方法,其中,所述连接分段图谱是基于针对所述领域的新鲜度要求来更新的。7.根据权利要求2所述的方法,其中,所述预先定义的标准与所述连接分段图谱的新鲜度、正确性、以及属性覆盖中的至少一个相关联。8.根据权利要求1所述的方法,其中,所述知识图谱和所述连接分段图谱是以平面表格格式存储的。9.根据权利要求1所述的方法,其中,所述知识图谱和所述连接分段图谱是通过使用反向索引来搜索的。10.根据权利要求5所述的方法,其中,所述实体匹配用于为所述实体数据集中的每个实体数据项分配实体ID。11.一种用于建立特定于领域的连接分段图谱的装置,所述方法包括:收集模块,其被配置为从与所述领域相关联的源收集实体数据,以形成针对...
【专利技术属性】
技术研发人员:文宁,刘大凡,沈徽,陈亮,韩殿飞,胡家樟,李京伦,李璞,赵振宇,杨懋,郭振宇,张雄,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。