一种本体构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26171199 阅读:20 留言:0更新日期:2020-10-31 13:42
本发明专利技术实施例提供了一种本体构建方法、装置、电子设备及存储介质,其特征在于,该方法包括:获取用于构建本体的目标数据;对目标数据中的结构化数据进行实例化处理,得到结构化数据中包括的各个第一对象;以及,对目标数据中的非结构化数据进行实例化处理,得到非结构化数据中包括的各个第二对象;从本体模板库中确定与各个第一对象均匹配的目标本体模板;利用第二对象的类型,对目标本体模板中的对象字段进行补充;将各个第一对象和各个第二对象映射到补充后的目标本体模板,得到目标数据对应的本体。通过本发明专利技术实施例提供的技术方案,可以提高目标数据对应的本体的数据完善度。

【技术实现步骤摘要】
一种本体构建方法、装置、电子设备及存储介质
本专利技术涉及计算机
,特别是涉及一种本体构建方法、装置、电子设备及存储介质。
技术介绍
本体是对真实世界中的实体、实体涉及的事件信息、实体之间的关系以及事件信息之间的关系的描述,用户可以在本体中对被本体描述的实体进行查询。例如,本体描述的实体为人,用户可以在该本体中查询人涉及的事件信息。相关技术中,利用数据构建本体的过程为:获得待构建本体的目标数据,对目标数据中的结构化数据进行实例化处理,得到结构化数据包括的对象;从本体模板库中选取与所得到的对象匹配的本体模板,并将数据映射到该本体模板,得到目标数据对应的本体。其中,对象可以为:实体、实体涉及的事件信息、实体之间的关系及事件信息之间的关系等,本体模板中包括多个对象字段,所谓的映射即为将每一对象作为相匹配对象字段的字段内容。但是,相关技术中,在构建本体时,用于构建本体的本体模板即为依赖数据中的结构化数据来选取本体模板,这样,对于包含结构化数据和非结构化数据的目标数据而言,所构建的本体中仅仅包括结构化数据,导致所构建的本体的数据完善度不高。本文档来自技高网...

【技术保护点】
1.一种本体构建方法,其特征在于,所述方法包括:/n获取用于构建本体的目标数据;/n对所述目标数据中的结构化数据进行实例化处理,得到所述结构化数据中包括的各个第一对象;以及,对所述目标数据中的非结构化数据进行实例化处理,得到所述非结构化数据中包括的各个第二对象;/n从本体模板库中确定与所述各个第一对象均匹配的目标本体模板;/n利用所述第二对象的类型,对所述目标本体模板中的对象字段进行补充;/n将所述各个第一对象和各个第二对象映射到补充后的目标本体模板,得到所述目标数据对应的本体。/n

【技术特征摘要】
1.一种本体构建方法,其特征在于,所述方法包括:
获取用于构建本体的目标数据;
对所述目标数据中的结构化数据进行实例化处理,得到所述结构化数据中包括的各个第一对象;以及,对所述目标数据中的非结构化数据进行实例化处理,得到所述非结构化数据中包括的各个第二对象;
从本体模板库中确定与所述各个第一对象均匹配的目标本体模板;
利用所述第二对象的类型,对所述目标本体模板中的对象字段进行补充;
将所述各个第一对象和各个第二对象映射到补充后的目标本体模板,得到所述目标数据对应的本体。


2.根据权利要求1所述的方法,其特征在于,所述利用所述第二对象的类型,对所述目标本体模板中的对象字段进行补充的步骤,包括:
判断各个第二对象的类型是否存在于目标本体模板的对象字段中;
针对每个第二对象,如果该第二对象的类型不存在于目标本体模板的对象字段中,将该第二对象的类型添加到目标本体模板的对象字段中。


3.根据权利要求2所述的方法,其特征在于,所述第二对象的类型为:实体、实体涉及的事件信息、实体之间的关系或事件信息之间的关系。


4.根据权利要求3所述的方法,其特征在于,所述对所述目标数据中的非结构化数据进行实例化处理,得到所述非结构化数据中包括的各个第二对象的步骤,包括:
确定所述目标数据中的非结构化数据中的词串;
从词性为名词的各个词串中,提取语义信息为预定语义信息的词串,作为实体,其中,预定语义信息为表征实体的语义信息;
利用目标抽取模板,抽取所提取的实体之间的关系,以及,所提取的实体涉及的事件信息,其中,所述目标抽取模板为:预先设定的多个抽取模板中,与所述目标数据中的非结构化数据匹配的抽取模板,不同领域的非结构化数据,对应不同的抽取模板;
根据事件的链式依赖关系及事件的发展方向,确定所抽取的事件信息之间的事件关系。


5.根据权利要求4所述的方法,其特征在于,在所述利用目标抽取模板,抽取所提取的实体之间的关系,以及,所提取的实体涉及的事件信息的步骤之后,所述方法还包括:
判断所抽取的实体涉及的事件信息中,是否有存在矛盾或者冲突的事件信息;
若为是,对存在矛盾或者冲突的事件信息进行歧义消除。


6.一种本体构建装置,其特征在于,所述装置包括:
数据获取模块,用于获取用于构建本体的目标数据;
数据处理模块,用于对所述目标数据中的结构化数据进行实例化处理,得到所述结构化数据中包括的各个第一对象;以及,对所述目标数据中的非结构化数据进行实例化处理,得到所述非结构化数据中包括的...

【专利技术属性】
技术研发人员:展丽霞姜伟浩浦世亮闫春
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1