The invention discloses an automatic semantic annotation method for an Internet of things device. The invention adopts the networking device description framework for describing networking equipment, equipment information through screening and filtering are divided into functional and non functional information of equipment equipment, and adopt different classification methods, and then after the two part of the classification results from the device ontology integration based on semantic similarity of ontology concepts as URI screening the semantic labels for labeling. Considering the scalability of the method, a device ontology extension is proposed to extend the device ontology to ensure the accuracy of semantic tag selection. The automatic semantic annotation method for the Internet of things device of the invention can improve the automatic semantic annotation efficiency of the mass equipment in the semantic Internet of things, and further improve the performance of the service discovery system.
【技术实现步骤摘要】
一种面向物联网设备的自动语义标注方法
本专利技术属于语义物联网中,自动语义标注领域,具体涉及物联网设备描述框架、自动语义标注和设备本体扩展方法。
技术介绍
语义技术是解决物联网中海量、异构、分布式实体间信息交互的关键技术,将实体和被感知、存储和处理的信息进行语义标注则是物联网语义化的基础。物联网领域的语义标注是通过对物联网实体和数据进行语义标注,使物联网实体能够利用统一的富含语义的形式进行描述,为服务层的语义服务发现提供支撑。目前关于语义标注的研究中,出现了一个语义标注平台,包括AeroDAML,SMT,MnM,Armadillo等;大部分研究集中在Web文档语义标注,基于模糊的形式和关系概念分析方法构建本体并用于标注,或使用基于维基百科大语料的词相似度技术或自然语言处理技术和TF-IDF来筛选标签标注,或基于相似规则归纳和基于条件随机场以及它们的改进算法的语义标注方法;物联网环境下的语义标注的研究较少,主要针对的是传感网中的数据,提出一些手动标注框架和语义推理算法。然而,现有的语义标注工具和平台以及Web文档语义标注,大多以文本标注和Web网页为研究对象,由于物联网设备的实物特性,比如空间、时间、环境等特点,对语义标注提供了新的要求,其标注结果往往不能满足需求;而现有的物联网环境下的语义标注主要面向的是传感器数据,且是手动语义标注方法,但是,面对海量的物联网实体,特别是数量仍在迅猛增长的物联网设备,手动或半自动语义标注显得力不从心,设备作为物联网实体的主要组成部分,针对物联网设备的自动语义标注方法的研究成为亟待解决的问题。因此,已有的语义标注方法,都不能 ...
【技术保护点】
一种面向物联网设备的自动语义标注方法,其特征在于采用物联网设备描述框架描述物联网中的设备,物联网设备描述框架包括六个组成属性,即标识信息、性能指标、功能属性、设备状态、接口属性和工作环境;在设备描述框架的基础上将自动语义标注方法分为两个阶段即信息抽取阶段和标注阶段,信息抽取阶段从物联网设备信息中抽取出具体的信息,在信息抽取阶段,根据文字的不同特性,将设备的信息划分成两个部分即设备功能信息和设备非功能信息;标注阶段从本体中选取概念来为抽取出来的信息进行标注;整个自动语义标注分为五个步骤来完成,即信息的筛选和提取,设备功能信息提取,设备功能信息分类,属性信息域的分割和信息整合与语义标签选择。
【技术特征摘要】
1.一种面向物联网设备的自动语义标注方法,其特征在于采用物联网设备描述框架描述物联网中的设备,物联网设备描述框架包括六个组成属性,即标识信息、性能指标、功能属性、设备状态、接口属性和工作环境;在设备描述框架的基础上将自动语义标注方法分为两个阶段即信息抽取阶段和标注阶段,信息抽取阶段从物联网设备信息中抽取出具体的信息,在信息抽取阶段,根据文字的不同特性,将设备的信息划分成两个部分即设备功能信息和设备非功能信息;标注阶段从本体中选取概念来为抽取出来的信息进行标注;整个自动语义标注分为五个步骤来完成,即信息的筛选和提取,设备功能信息提取,设备功能信息分类,属性信息域的分割和信息整合与语义标签选择。2.根据权利要求1所述的一种面向物联网设备的自动语义标注方法,其特征在于所述信息的筛选和提取具体是,使用小标题训练字典,并使用字典识别新样本中的小标题并提取小标题之间的信息,信息的筛选和提取与设备功能信息提取两个步骤所使用的方法都是信息提取方法,只是所使用的训练集不同。3.根据权利要求1所述的一种面向物联网设备的自动语义标注方法,其特征在于所述设备功能信息分类具体是,将训练集和样本集中的文本转换成向量,借助TF-IDF(termfrequency–inversedocumentfrequency)技术,使用TF和IDF生成向量并使用IDF和设...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。