The embodiment of the invention discloses a method, a device, a system and a storage medium for constructing the knowledge map of human object attribute classification. The method includes: obtaining the human object data, extracting the concept of the object data, determining at least one concept of the person object, determining the attribute classification of the concept and the relation between the concepts according to the presupposition rules, and constructing the attribute classification of the human object according to the attribute classification and the Association relationship of the concept described. Class knowledge map. The embodiment of the invention solves the problem of disordered classification of human object attributes and disunity of information, and realizes the automatic establishment of knowledge atlas of human object attribute classification, and improves the comprehensiveness and unity of the generalization of human object attributes.
【技术实现步骤摘要】
人对象属性分类知识图谱的构建方法及装置
本专利技术实施例涉及大数据挖掘技术,尤其涉及人对象属性分类知识图谱的构建方法及装置。
技术介绍
随着信息化的快速发展,各行各业都面临着大数据处理的问题,如何从大数据中通过数据挖掘、机器学习等关键技术,从大数据中提出有价值的信息,支撑面临日益复杂的业务需求,是各行各业亟待解决的问题。越来越多行业的研究对象已经逐渐聚焦于人对象的研究,研究人对象的本质、人对象的行为及各种爱好和习惯,以此来提高服务质量同时能够获得更大的商业价值。描述一个人对象是一个复杂的过程,许多“以人为本”的行业,在刻画人对象时没有统一的规范,属性多少和属性的分类均是按照各自需求,在属性分类无法全面的概括人对象的各个方面的信息。同时随着科技的高速发展,云计算和云处理等新技术正在构建一个由信息构成的“镜像世界”,并将真实和虚拟两个世界的信息人完全统一起来。虚拟世界使人的活动空间从现实延伸到虚拟空间。但是虚拟空间的核心之一的人对象的信息杂乱无章,无法清晰的描述和管理人对象的信息。
技术实现思路
本专利技术实施例提供一种基于人对象属性分类知识图谱的构建方法及装置,实现了自动构建人对象属性分类知识图谱。第一方面,本专利技术实施例提供了一种人对象属性分类知识图谱的构建方法,该方法包括:获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;根据预设规则确定概念的属性分类和各概念间的关联关系,并根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。第二方面,本专利技术实施例还提供了一种人对象属性分类知识图谱的构建装置,该装置包括:概念 ...
【技术保护点】
1.一种人对象属性分类知识图谱的构建方法,其特征在于,包括:获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;根据预设规则确定概念的属性分类和各概念间的关联关系;根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。
【技术特征摘要】
1.一种人对象属性分类知识图谱的构建方法,其特征在于,包括:获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;根据预设规则确定概念的属性分类和各概念间的关联关系;根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。2.根据权利要求1所述的方法,其特征在于,人对象数据为人对象的知识数据,相应的,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念,包括:抽取所述人对象的知识数据中的概念词;对所述概念词进行概念加工,生成至少一个概念,其中概念加工至少包括对所述概念词对应的数据进行数据清洗和数据规范化。3.根据权利要求1所述的方法,其特征在于,人对象数据为人对象的样本数据,相应的,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念,包括:提取所述人对象的样本数据的数据结构和数据,其中,所述样本数据为结构化数据;对所述数据结构或数据进行概念抽取,生成人对象的至少一个概念。4.根据权利要求3所述的方法,其特征在于,对所述数据结构或数据进行概念抽取,生成人对象的至少一个概念,包括:对所述数据结构的元数据进行聚类处理,根据聚类结果确定至少一个概念;或,将所述数据输入至机器学习模型,根据所述机器学习模块的输出结果至少一个概念。5.根据权利要求4所述的方法,其特征在于,根据预设规则确定概念的属性分类和各概念间的关联关系,包括:根据所述数据结构中的元数据确定所述概念的数据元组,其中,所述数据元组至少包括所述概念、概念属性和概念的关联关系;或,对所述机器学习模块的输出结果进行提取与合并,确定所述概念的属性分类,根据预设规则确定所述概念的关联关系。6.根据权利要求5所述的方法,其特征在于,根据所述...
【专利技术属性】
技术研发人员:谢永恒,王梅,火一莽,万月亮,
申请(专利权)人:北京锐安科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。