The query method based on semantic ontology, including the present invention discloses a large data environment: Based on the user queries the query interface extraction ontology to generate the first query; the first query conversion query second by ontology reasoning tool, second queries and the global ontology; second the query is decomposed into third queries, third queries associated with local ontology; according to the mapping between local ontology and relational database, the third query conversion fourth query fourth query and relational database; and the use of fourth query relational database query, query results and returns to the user. The invention adopts the extraction of the semantic of the ontology to realize the expansion and the decomposition of the semantic attribute, to realize the property of mining the implicit in the semantics, and to improve the matching speed and the accuracy of the semantic.
【技术实现步骤摘要】
本专利技术涉及大数据的处理
,尤其涉及一种大数据环境下基于本体语义的查询方法及系统。
技术介绍
在现在的大数据时代环境下,数据具有多源异构、分布广泛、动态增长等特性,传统的数据管理模式已不适应大数据环境,目前的系统检索功能已不再能满足人们多样的需求。传统的数据检索方法依据检索对象的不同,可以分为文本检索和多媒体检索。文本检索是指基于文字的检索,它是最早也是最常见的信息表现形式,在信息检索研究中占有基础地位。多媒体检索的对象包括图像、动画、音频和视频,但大多数多媒体检索系统扔采取基于文本关键字的搜索技术。依据检索的不同,文本检索可以分为全文检索和字段检索。全文检索的特点是把用户的查找请求和全文中的每一个词进行比较,不考虑请求与文本语义上的匹配,这种方式虽然可以保证查全率,但是查准率却大大降低了。字段检索只在某些信息点进行匹配,它的性能取决于所使用的标识字段的方法和用户对这种方法的理解,因此具有很大的局限性,字段检索支持语义匹配的能力也较差。在传统基于关键词检索方法中,产生误检、漏检的一个重要原因是用户的需求表达与信息系统的表示方式不一致,实质上是对领域知识理解的不一致,要解决这个问题必须采取某种人和机器都能理解的中间语言来促进人机交流,消除人和机器对同一信息的认同误区。本体论可以用来捕获相关的领域知识,形成对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇之间相互关系的明确定义。
技术实现思路
本专利技术的目的在于解决现有的数据检索方法中的语义匹配能力较差的问题,提供一种大数据环境下基于本体语义的查询方法及系 ...
【技术保护点】
一种大数据环境下基于本体语义的查询方法,其特征在于,包括以下步骤:根据用户在查询界面提出的查询请求提取本体语义以生成第一查询语句;通过本体推理机进行推理将所述第一查询语句转换为第二查询语句,所述第二查询语句与全局本体相关;将所述第二查询语句分解为第三查询语句,所述第三查询语句与局部本体相关;根据所述局部本体和关系数据库之间的映射关系,将所述第三查询语句转换第四查询语句,所述第四查询语句与所述关系数据库相关;以及利用所述第四查询语句查询所述关系数据库,生成查询结果并返回给用户。
【技术特征摘要】
1.一种大数据环境下基于本体语义的查询方法,其特征在于,包括以下步骤:根据用户在查询界面提出的查询请求提取本体语义以生成第一查询语句;通过本体推理机进行推理将所述第一查询语句转换为第二查询语句,所述第二查询语句与全局本体相关;将所述第二查询语句分解为第三查询语句,所述第三查询语句与局部本体相关;根据所述局部本体和关系数据库之间的映射关系,将所述第三查询语句转换第四查询语句,所述第四查询语句与所述关系数据库相关;以及利用所述第四查询语句查询所述关系数据库,生成查询结果并返回给用户。2.根据权利要求1所述的大数据环境下基于本体语义的查询方法,其特征在于,通过本体推理机进行推理将所述第一查询语句转换为第二查询语句的所述步骤包括:利用所述本体推理机,在全局本体库中检索与用户的所述查询请求中包含的数据语义相关的全局本体;根据检索到的所述全局本体,重新构造查询语句,将所述第一查询语句转换为所述第二查询语句。3.根据权利要求1所述的大数据环境下基于本体语义的查询方法,其特征在于,在将所述第二查询语句分解为第三查询语句的所述步骤中,利用查询控制返回的结果和全局本体和局部本体之间的映射表,将所述第二查询语句分解为所述第三查询语句。4.根据权利要求1-3所述的大数据环境下基于本体语义的查询方法,其特征在于,利用资源描述框架RDF来描述所述全局本体和所述局部本体。5.一种大数据环境下基于本体语义的查询系统,其特征在...
【专利技术属性】
技术研发人员:都政,易明祥,陈远磊,张冬云,熊超超,罗文龙,
申请(专利权)人:国家超级计算深圳中心深圳云计算中心,深圳云计算中心有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。