一种针对物联网数据的自动语义标注系统技术方案

技术编号:32933128 阅读:13 留言:0更新日期:2022-04-07 12:24
本发明专利技术涉及一种针对物联网数据的自动语义标注系统,属于物联网技术和语义网技术结合领域,包括物联网传感器数据预处理模块、物联网领域本体模块、数据RDF处理模块和语义标注模块;物联网传感器数据预处理模块用于对传感器数据进行分析预处理,对感知数据进行格式和位置分析,并使用聚类算法挖掘数据中隐含的知识信息;物联网领域本体模块用于表示物联网中传感器节点数据的语义概念和概念的属性、关系;数据RDF处理模块用于将经过预处理的物联网传感器数据流格式化转换成包含语义信息的RDF格式数据;语义标注模块使用基于SWRL语言定义的推理规则为经过聚类分析后的RDF三元组格式的传感器数据流添加概念和属性。格式的传感器数据流添加概念和属性。格式的传感器数据流添加概念和属性。

【技术实现步骤摘要】
一种针对物联网数据的自动语义标注系统


[0001]本专利技术属于物联网技术和语义网技术结合领域,涉及一种针对物联网数据的自动语义标注系统。

技术介绍

[0002]物联网技术的快速发展,使各种物联网产品层出不穷,一方面,硬件价格下降,另一方面,日常设备和器具配备了功能更强的硬件,导致传感器节点的数量不断增加。海量数据需要各种操作才能实现高质量的数据处理,如实时报告、空间分布、传感器的多样性以及有效处理数据等。由于传感器设备来源于不同厂商,不同传感器具有不同的数据输出格式、精度、数据长度,即使同一类型传感器由于设计原因和厂商的不同,数据的输出形式也会存在差别。同时,这些异构数据还极大增加了物联网各系统之间资源协同交互、数据融合及分析推理的复杂度,并且还为数据资源的跨域共享及重用带来了极大困难与局限性。因此造成了数据之间相互孤立,不能发挥出数据价值的最大效用。对于数据资源的有效处理是实现智能服务的前提,但机器却难以对这些异构数据进行融合共享操作。因此,如何屏蔽数据间异构性和孤立性,更好地理解不同设备所产生的数据信息含义,挖掘出各类数据的深层价值,从而提高数据利用率,满足复杂多变的上层应用需求,这已成为目前物联网数据处理领域所研究的热点问题。
[0003]在物联网中语义标注技术来解决对海量、多源、异构的物联网数据的统一描述问题,通过使用一种国际标准化的数据描述语言为基础来实现异构数据之间的互操作,从而提升物联网主体理解信息、关联信息的能力。对物联网数据使用语义描述背后的关键思想是实现物联网数据的表示、形式化和增强互操作性。本体可以用来存储语义概念,这些语义概念表示真实世界中的现象和属性,由于标准化的数据表示,机器也可以理解这些现象和属性。
[0004]现有的物联网数据自动语义标注、处理方法和系统一般只针对物联网设备进行语义描述,且未对任何数据进行处理达到异构数据源的相同语义表示,现有的标注字典生成方法只适用于文本内容,且不适用于大规模数据集;现有技术根据语义信息相似度筛选本体概念,准确率和效率都低。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种对物联网传感器数据进行自动语义标注系统,基于KMA聚类算法,实现数据分类,提升物联网主体(计算机、各类终端应用)理解信息、关联信息的能力,并提升语义注释准确性和效率,实现较大规模数据的精准标注,减少计算机资源消耗。
[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]一种针对物联网数据的自动语义标注系统,包括物联网传感器数据预处理模块、物联网领域本体模块、数据RDF处理模块和语义标注模块;
[0008]所述物联网传感器数据预处理模块用于对传感器数据进行分析预处理,对感知数据进行格式和位置分析,并使用聚类算法挖掘数据中隐含的知识信息,为语义标注做准备。
[0009]所述物联网领域本体模块用于表示物联网中传感器节点数据的语义概念和概念的属性、关系;包括传感器节点信息、数据类型、环境状态等概念。
[0010]所述数据RDF处理模块用于将经过预处理的物联网传感器数据流格式化成本体中的数据形式,即转换成包含语义信息的RDF格式数据;RDF三元组是语义网数据表示的基础,构建RDF数据集是实现语义标注的一项基础性工作。
[0011]所述语义标注模块使用基于SWRL语言定义的推理规则为经过聚类分析后的RDF三元组格式的传感器数据流添加概念和属性。该规则的语法基于语义Web规则语言(SWRL),该语言可以根据元数据信息和外部数据资源提取规则,实现自动定义标签,SWRL中定义的规则遵循语法形式:其中consequent是用于标记概念和属性以及实现先行规则的预期名称。
[0012]进一步,所述物联网传感器数据预处理模块使用KMA聚类算法,将数据降维处理并挖掘出数据中隐含的知识信息,最终将数据输出为JSON格式。
[0013]进一步,所述KMA聚类算法,该算法基于k

modes和蚁群聚类两种机器学习算法改进,具体算法步骤如下:
[0014]1)任意选择k个对象作为初始聚类中心;
[0015]2)将每个对象指定给最相似的中心;
[0016]3)更新集群质心;
[0017]4)合并集群质心;
[0018]5)返回到步骤2),直到质心不再更改为止;
[0019]6)对每个数据对象到相应的聚类中心K分配初始不同的信息素ω,保证簇中各样本路径上的信息素要多于各簇之间的信息素;
[0020]7)根据路径上的信息素计算蚂蚁转移概率,将数据分类到相似簇中;
[0021]8)完成一次遍历后,信息素更新迭代;
[0022]9)当最小距离不再变化或者达到设定的迭代次数时,算法终止,输出最优聚类结果;
[0023]此过程完成数据分类处理并挖掘出数据中隐含的知识信息,最终输出JSON格式文档。
[0024]进一步,所述物联网领域本体模块是基于传感器网络本体(SSN)的相关概念和关系,并结合具体的物联网环境,添加额外的概念、属性和关系集合,所构建的物联网领域本体是针对物联网数据的知识集合。
[0025]进一步,SSN本体没有对传感器进行分类且对传感器数据描述能力不足,因此,构建适用于传感器数据自动语义标注的本体,必须要结合目前构建本体相关技术,参照经典本体的构建形式及内容,遵循以下步骤的本体构建流程完成面向物联网领域本体的设计与实现。
[0026]所述构建物联网领域本体,包括以下步骤:
[0027]确定领域概念;
[0028]建立概念的数据类型属性;
[0029]建立概念间的父子类关系;
[0030]建立概念与概念间的关系;
[0031]建立概念的实例,确定实例间的关系;
[0032]形成本体的逻辑体系结构。
[0033]进一步,所述数据RDF处理模块采用RDF转换算法,将经过预处理输出JSON格式文档中的数据转换为具有主语、谓语和宾语形式的RDF三元组。其中的RDF三元组用于表示数据信息,并使其能在应用程序交换过程中保持稳定,达到不丢失语义信息的效果。RDF数据可以使用xml或者Turtle格式的文档进行描述。
[0034]进一步,语义标注模块使用基于SWRL语言定义的推理规则为经过聚类分析后的RDF三元组格式的传感器数据流添加概念和属性;SWRL语言中定义的规则遵循语法形式为:其中consequent用于标记概念和属性以及实现先行规则的预期名称。
[0035]进一步,语义标注模块首先解析物联网领域本体,将物联网领域本体中定义的概念、属性和关系作为语义标注规则基准信息集,根据该基准信息集对聚类分析后包含知识信息的RDF三元组数据,使用SWRL语言标记聚类结果中提取的未命名概念和属性,并将语义信息实时集成到物联网环境中的异构传感器流数据中,从而实现自动语义标注,最终将标注后的数据存入AllegroGraph图形数据库并更新本体。
[0036]本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对物联网数据的自动语义标注系统,其特征在于:包括物联网传感器数据预处理模块、物联网领域本体模块、数据RDF处理模块和语义标注模块;所述物联网传感器数据预处理模块用于对传感器数据进行分析预处理,对感知数据进行格式和位置分析,并使用聚类算法挖掘数据中隐含的知识信息;所述物联网领域本体模块用于表示物联网中传感器节点数据的语义概念和概念的属性、关系;所述数据RDF处理模块用于将经过预处理的物联网传感器数据流格式化成本体中的数据形式,即转换成包含语义信息的RDF格式数据;所述语义标注模块使用基于SWRL语言定义的推理规则为经过聚类分析后的RDF三元组格式的传感器数据流添加概念和属性。2.根据权利要求1所述的针对物联网数据的自动语义标注系统,其特征在于:所述物联网传感器数据预处理模块使用KMA聚类算法,将数据降维处理并挖掘出数据中隐含的知识信息,最终将数据输出为JSON格式。3.根据权利要求2所述的针对物联网数据的自动语义标注系统,其特征在于:所述KMA聚类算法,该算法基于k

modes和蚁群聚类两种机器学习算法改进,具体算法步骤如下:1)任意选择k个对象作为初始聚类中心;2)将每个对象指定给最相似的中心;3)更新集群质心;4)合并集群质心;5)返回到步骤2),直到质心不再更改为止;6)对每个数据对象到相应的聚类中心K分配初始不同的信息素ω,保证簇中各样本路径上的信息素要多于各簇之间的信息素;7)根据路径上的信息素计算蚂蚁转移概率,将数据分类到相似簇中;8)完成一次遍历后,信息素更新迭代;9)当最小距离不再变化或者达到设定的迭代次数时,算法终止,输出最优聚类结果;此过程完成数据分类处理并挖掘出数据中隐含的知识信息,最...

【专利技术属性】
技术研发人员:耿道渠李海洋周雷王平
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1