人对象属性分类知识图谱的构建方法及装置制造方法及图纸

技术编号:18256582 阅读:35 留言:0更新日期:2018-06-20 08:20
本发明专利技术实施例公开了人对象属性分类知识图谱的构建方法、装置、系统及存储介质。该方法包括:获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;根据预设规则确定概念的属性分类和各概念间的关联关系;根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。本发明专利技术实施例解决了人对象属性的分类混乱、信息不统一的问题,实现了自动建立人对象属性分类知识图谱,提高了人对象属性的概括的全面性和统一性。

Method and device for constructing knowledge map of human object attribute classification

The embodiment of the invention discloses a method, a device, a system and a storage medium for constructing the knowledge map of human object attribute classification. The method includes: obtaining the human object data, extracting the concept of the object data, determining at least one concept of the person object, determining the attribute classification of the concept and the relation between the concepts according to the presupposition rules, and constructing the attribute classification of the human object according to the attribute classification and the Association relationship of the concept described. Class knowledge map. The embodiment of the invention solves the problem of disordered classification of human object attributes and disunity of information, and realizes the automatic establishment of knowledge atlas of human object attribute classification, and improves the comprehensiveness and unity of the generalization of human object attributes.

【技术实现步骤摘要】
人对象属性分类知识图谱的构建方法及装置
本专利技术实施例涉及大数据挖掘技术,尤其涉及人对象属性分类知识图谱的构建方法及装置。
技术介绍
随着信息化的快速发展,各行各业都面临着大数据处理的问题,如何从大数据中通过数据挖掘、机器学习等关键技术,从大数据中提出有价值的信息,支撑面临日益复杂的业务需求,是各行各业亟待解决的问题。越来越多行业的研究对象已经逐渐聚焦于人对象的研究,研究人对象的本质、人对象的行为及各种爱好和习惯,以此来提高服务质量同时能够获得更大的商业价值。描述一个人对象是一个复杂的过程,许多“以人为本”的行业,在刻画人对象时没有统一的规范,属性多少和属性的分类均是按照各自需求,在属性分类无法全面的概括人对象的各个方面的信息。同时随着科技的高速发展,云计算和云处理等新技术正在构建一个由信息构成的“镜像世界”,并将真实和虚拟两个世界的信息人完全统一起来。虚拟世界使人的活动空间从现实延伸到虚拟空间。但是虚拟空间的核心之一的人对象的信息杂乱无章,无法清晰的描述和管理人对象的信息。
技术实现思路
本专利技术实施例提供一种基于人对象属性分类知识图谱的构建方法及装置,实现了自动构建人对象属性分类知识图谱。第一方面,本专利技术实施例提供了一种人对象属性分类知识图谱的构建方法,该方法包括:获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;根据预设规则确定概念的属性分类和各概念间的关联关系,并根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。第二方面,本专利技术实施例还提供了一种人对象属性分类知识图谱的构建装置,该装置包括:概念抽取模块,用于获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;概念信息确定模块,用于根据预设规则确定概念的属性分类和各概念间的关联关系;知识图谱构建模块,用于根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术任意实施例提供的一种人对象属性分类知识图谱的构建方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任意实施例提供的一种人对象属性分类知识图谱的构建方法。本专利技术实施例通过对人对象数据进行概念抽取,确定人对象的至少一个概念,根据预设规则确定概念的属性分类和各概念间的关联关系,并构建人对象属性分类知识图谱,解决了人对象属性的分类混乱、信息不统一的问题,实现了自动建立人对象属性分类知识图谱,提高了人对象属性的概括的全面性和统一性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的一种人对象属性分类知识图谱的构建方法的流程示意图;图2是本专利技术实施例一提供的人对象知识库示意图;图3是本专利技术实施例二提供的一种人对象属性分类知识图谱的构建方法的流程示意图;图4是本专利技术实施例三提供的一种人对象属性分类知识图谱的构建方法的流程示意图;图5是本专利技术实施例四提供的一种人对象属性分类知识图谱的构建装置的结构示意图;图6是本专利技术实施例提供五的一种计算机设备的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,以下将参照本专利技术实施例中的附图,通过实施方式清楚、完整地描述本专利技术的技术方案,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一图1是本专利技术实施例一提供的一种人对象属性分类知识图谱的构建方法的流程图。本实施例的技术方案可以适用于对人对象属性进行分类的情况。该方法可以由本专利技术实施例提供的人对象属性分类知识图谱的构建装置来执行,该装置可以采用软件和/或硬件的方式实现。该方法具体包括如下操作:S110、获取人对象数据,对人对象数据进行概念抽取,确定人对象的至少一个概念。其中,人对象数据指的是与人对象相关的数据,可选的,人对象数据为人对象的知识数据。可选的,人对象的知识数据可以是通过对开放域知识提取获得,其中开放域知识可以是国家标准和行业标准等,行业标准例如可以是但不限于金融行业标准、教育行业标准、医药行业标准、建筑行业标准、交通运输行业标准、服装行业标准、旅游行业标准和电子行业标准等。可选的,人对象的知识数据还可以是公司制定的规范和长期积累的专家知识中提取获得。企业的信息化过程中积累的企业内部和外部信息、企业中涉及领域的专家提供的知识,这些知识特点是逐渐积累并丰富,在短时间内不会经常变化。可选的,根据人对象相关的关键字在网络数据或者云数据中抓取人对象的知识数据。可选的,对人对象数据进行概念抽取,确定人对象的至少一个概念,包括:抽取人对象的知识数据中的概念词;对概念词进行概念加工,生成至少一个概念,其中概念加工至少包括对概念词对应的数据进行数据清洗和数据规范化。本实施例中,抽取人对象的知识数据中的概念词可以是通过人工方式或者自动方式获取,其中人工对人对象的知识数据进行概念词抽取指的是对人对象的知识数据进行分析、综合、整理和归纳,得到预设格式的概念。自动对人对象的知识数据进行概念词抽取可以是将人对象的知识数据输入至机器学习模型中,根据机器学习模型的输出结果确定概念词。示例性的,机器学习模型可以是神经网络模型。概念加工对概念抽取的数据机械能预处理的过程,预处理包括但不限于数据清洗和数据规范化,其中,数据清洗可以包括但不限于数据去重和数据降噪,用于提高数据质量,数据规范化指的是将不同格式的数据转换为预设格式。其中,不同概念对应的数据格式可以是不同的,示例性的,概念性别对应的数据格式可以是性别女为0,性别男为1,其他为2;概念手机号码的数据格式为在手机号码前添加+86。对数据进行数据清洗和规范化处理,消减数据维数,以便减少数据开采时需要考虑的特征数量和变量数量。S120、根据预设规则确定概念的属性分类和各概念间的关联关系。其中,预设规则可以是预先设置的,还可以是不断学的得到的,根据预设规则可确定每一个概念的属性和概念的关联关系,对属性进行分类可确定概念的属性分类。示例性的,预设概念可以是如下述所示:规则1->P(关系1,概念1,概念2);规则2->P(关系2,概念2,概念3);规则3->P(关系3,概念1,概念3);规则4->P(概念1,属性1-属性n,属性值1-属性值n);规则5->P(概念2,属性1-属性n,属性值1-属性值n)。其中,概念的关联关系指的是两个概念之间的关系,示例性的,参见表1,表1为概念关系的示例。表1概念关系英文说明子类关系is-a(kind-of)表示父类与子类的关系部分关系part-of表示整体与部分的关系实例关系instance-of表示概念的实例与概念间的关系属性关系att本文档来自技高网...
人对象属性分类知识图谱的构建方法及装置

【技术保护点】
1.一种人对象属性分类知识图谱的构建方法,其特征在于,包括:获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;根据预设规则确定概念的属性分类和各概念间的关联关系;根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。

【技术特征摘要】
1.一种人对象属性分类知识图谱的构建方法,其特征在于,包括:获取人对象数据,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念;根据预设规则确定概念的属性分类和各概念间的关联关系;根据所述概念的属性分类和所述概念的关联关系构建人对象属性分类知识图谱。2.根据权利要求1所述的方法,其特征在于,人对象数据为人对象的知识数据,相应的,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念,包括:抽取所述人对象的知识数据中的概念词;对所述概念词进行概念加工,生成至少一个概念,其中概念加工至少包括对所述概念词对应的数据进行数据清洗和数据规范化。3.根据权利要求1所述的方法,其特征在于,人对象数据为人对象的样本数据,相应的,对所述人对象数据进行概念抽取,确定所述人对象的至少一个概念,包括:提取所述人对象的样本数据的数据结构和数据,其中,所述样本数据为结构化数据;对所述数据结构或数据进行概念抽取,生成人对象的至少一个概念。4.根据权利要求3所述的方法,其特征在于,对所述数据结构或数据进行概念抽取,生成人对象的至少一个概念,包括:对所述数据结构的元数据进行聚类处理,根据聚类结果确定至少一个概念;或,将所述数据输入至机器学习模型,根据所述机器学习模块的输出结果至少一个概念。5.根据权利要求4所述的方法,其特征在于,根据预设规则确定概念的属性分类和各概念间的关联关系,包括:根据所述数据结构中的元数据确定所述概念的数据元组,其中,所述数据元组至少包括所述概念、概念属性和概念的关联关系;或,对所述机器学习模块的输出结果进行提取与合并,确定所述概念的属性分类,根据预设规则确定所述概念的关联关系。6.根据权利要求5所述的方法,其特征在于,根据所述...

【专利技术属性】
技术研发人员:谢永恒王梅火一莽万月亮
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1