本发明专利技术涉及一种基于上下文的语义匹配方法和系统。该方法包括:对不同数据源的数据分别建立语义上下文模型;对不同数据源的语义上下文模型进行语义比较;根据语义比较的结果,结合语义维度进行语义冲突类型分类;根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。该系统包括语义上下文模型建立模块、语义比较模块、语义冲突类型分类模块和语义转化模块。本发明专利技术能够解决不同服务的建立者和使用者在服务语义方面的匹配问题,为语义匹配、搜索和互操作提供方法和参考依据。
A context based semantic matching method and system
【技术实现步骤摘要】
一种基于上下文的语义匹配方法和系统
本专利技术属于软件
,涉及一种基于上下文的语义匹配方法和系统,尤其涉及针对服务模型的资源语义匹配方法。
技术介绍
基于语义的方法能够保证“物理上的连接”,还能实现“逻辑上的连接”,不同服务的建立者和使用者都希望其它的服务能够按着他们的方式来理解数据、信息和知识,使用他们的观点来定义这个世界的定义,来理解这个世界的构成。因此,一个最重要问题是如何调节不同应用服务间的语义冲突,也就是说,如何实现语义匹配。目前,共享本体是普遍采用的解决语义问题的方法。但是,利用共享本体解决语义问题存在明显的不足。我们知道,共享本体说明一个能够共同理解的词汇,并采用该词汇描述实体的共享信息和关系。使用本体解决语义冲突一般分为三步。首先,定义共享本体;其次,使用本体描述各个独立信息系统中的对象;最后,使用本体判断不同对象间的相似性。这种方法的前提条件是本体能够显著地减少判定异构信息系统不同对象间相似性的复杂性,这种前提条件是基于设计和构建本体的标准。与全局模式方法相似,基于本体的协调过程具有明显不足:从实际和理论两方面,开发和维护这样一个本体几乎是不可能的,特别是在不断进化的语义环境中;本体不支持对语义冲突的确定和分类;本体不提供语义冲突协调机制;本体是不允许同名异义的,对异名同义的解决也存在问题。另一种使用本体的方法是不同的系统维护自己的独立本体,通过合并两个独立本体来解决语义冲突,但是合并本体的过程同样也是一个复杂的语义协调过程。面向复杂的问题、大量的知识以及多种媒体时,表示上下文始终是一个挑战。在形式化方法中,上下文作为一种抽象的数学实体,最基本的关系是ist(c,p),表示断言p在上下文环境c中,命题为真。在普适计算中,使用属性和值对的方法建模上下文,该上下文被用于分布式服务框架,服务本身使用简单的具有值的属性列表,服务发现过程等同于对这些属性的精确匹配。属性和值对的上下文表示方法虽然易于管理,但其主要不足是过于简单、缺乏构建复杂上下文的能力。另一类是采用标记语言描述上下文,它是基于profile(简况)的概念,如ComprehensiveStructuredContextProfiles(复合结构化上下文简况),在这种方法中,属性名称是上下文敏感的,需要使用profile(简况)中的位置信息来解释。CompositeCapabilities/PreferencesProfileContextExtension(复合能力/引用简况上下文扩展)针对属性的特定方面扩展了UserAgentProfile(用户代理简况)等词汇,例如位置信息、特定关系类型和依赖,该方法也可以支持context-aware(上下文意识)应用和部分普适计算基础架构,但是对于捕获复杂的上下文关系和约束比较困难。也有扩展了对象角色模型,提出一种上下文图形建模方法,主要依据是上下文分类和描述特征,如,上下文分类包括静态和动态,动态分类又包括profiled(简况)、sensed(感应)、derived(引导),并通过dependsOn(依赖)关系表示一个事实的改变导致另一个事实的改变,这种方法较适合于普适计算应用领域。还有方法使用从Aspect-Scale-ContextInformation(方面-扩展-上下文信息)三个方面组织上下文,使用本体作为形式化基础,并定义一种ContextOntologyLanguage(上下文本体语言)。上下文本体语言上下文建模方法就是基于“方面-扩展-上下文信息”概念,创建上层本体捕获上下文实体的基本特征,并可转化为web本体语言,在语义上等价于描述逻辑,允许一致性检查和推理。
技术实现思路
本专利技术的目的在于:针对现有技术的缺失和不足,提出一种基于上下文的语义匹配方法和系统,解决不同服务的建立者和使用者在服务语义方面的匹配问题,为语义匹配、搜索和互操作提供方法和参考依据。本专利技术采用的技术方案如下:一种基于上下文的语义匹配方法,包括以下步骤:对不同数据源的数据分别建立语义上下文模型;对不同数据源的语义上下文模型进行语义比较;根据语义比较的结果,结合语义维度进行语义冲突类型分类;根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。进一步地,所述语义上下文模型包括本体词汇以及围绕该本体词汇的语义上下文。进一步地,所述语义比较是对上下文格子进行比较,包括对上下文格子的特定化、泛化、交叉、一致四种基础的比较操作。进一步地,所述语义比较包括:基于语义上下文模型建立语义匹配模型;所述语义匹配模型以一个名词为中心,扩展多个分支,多个分支用于描述相关的上下文信息;所述语义匹配模型中包含上下文格子;基于所述语义匹配模型中的上下文格子,进行四种比较操作:特定化、泛化、交叉、一致。进一步地,所述语义冲突类型分类,其中的语义冲突类型包括命名、抽象、异构,所述命名包括同义词、同名异义词、无关词,所述抽象包括类、聚集、泛化。进一步地,所述语义转化是进行两个语义相同的词汇在不同上下文环境中的转化。进一步地,所述语义转化包括精度、数值取值范围、类型、计量单位的转化。一种基于上下文的语义匹配系统,其包括:语义上下文模型建立模块,用于对不同数据源的元数据分别建立语义上下文模型;语义比较模块,用于对不同数据源的语义上下文模型进行语义比较;语义冲突类型分类模块,用于根据语义比较的结果,结合语义维度进行语义冲突类型分类;语义转化模块,用于根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。一种电子装置,其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本专利技术的基于上下文的语义匹配方法的指令。一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本专利技术的基于上下文的语义匹配方法。本专利技术与现有技术相比的优点在于:(1)以语义冲突类型分类为判定语义冲突的路线,以语义维度为可操作的评价标准,同时区分语义匹配模型和语义转化模型,完成语义匹配和上下文环境差异转化。(2)初步划分语义冲突类型和语义维度,构建了语义互操作模型。(3)基于语义互操作模型,建立了可操作、可比较的语义互操作方法和语义关系。(4)能够解决不同服务的建立者和使用者在服务语义方面的匹配问题,为语义匹配、搜索和互操作提供方法和参考依据。附图说明图1是本专利技术的语义匹配原理图;图2是本专利技术的语义匹配算法实施原理图;图3是语义格子、语义匹配模型和语义转化模型的示意图。具体实施方式以下结合具体实施例和附图对本专利技术作更详细的说明。本专利技术的一种基于上下文的语义匹配方法,其核心实现如图1所示,通过采用本体和上下文相结合的方法构建语义上下文模型、语义冲突类型分类和本文档来自技高网...
【技术保护点】
1.一种基于上下文的语义匹配方法,其特征在于,包括以下步骤:/n对不同数据源的数据分别建立语义上下文模型;/n对不同数据源的语义上下文模型进行语义比较;/n根据语义比较的结果,结合语义维度进行语义冲突类型分类;/n根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。/n
【技术特征摘要】
1.一种基于上下文的语义匹配方法,其特征在于,包括以下步骤:
对不同数据源的数据分别建立语义上下文模型;
对不同数据源的语义上下文模型进行语义比较;
根据语义比较的结果,结合语义维度进行语义冲突类型分类;
根据语义冲突类型分类的结果,采用定制的转化规则进行语义转化,从而实现语义匹配。
2.根据权利要求1所述的方法,其特征在于,所述语义上下文模型包括本体词汇以及围绕该本体词汇的语义上下文。
3.根据权利要求1所述的方法,其特征在于,所述语义比较是对上下文格子进行比较,包括对上下文格子的特定化、泛化、交叉、一致四种基础的比较操作。
4.根据权利要求3所述的方法,其特征在于,所述语义比较包括:
基于语义上下文模型建立语义匹配模型;所述语义匹配模型以一个名词为中心,扩展多个分支,多个分支用于描述相关的上下文信息;所述语义匹配模型中包含上下文格子;
基于所述语义匹配模型中的上下文格子,进行四种比较操作:特定化、泛化、交叉、一致。
5.根据权利要求1所述的方法,其特征在于,所述语义冲突类型分类,其中的语义冲突类型包括命名、抽象、异构,所述命名包括同义词、同名异义词、无关词,所述抽象包括...
【专利技术属性】
技术研发人员:徐罡,王焘,张文博,吴恒,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。