【技术实现步骤摘要】
一种多源异构油耗数据特征提取及融合方法
本专利技术属于多源异构数据融合
,特别涉及一种多源异构油耗数据特征提取及融合方法。
技术介绍
船舶油耗评估主要包含数据处理和评估建模两部分。其中,数据处理是船舶油耗评估中的关键技术,数据处理的效果将直接影响评估精度。在航海实践中,船舶油耗数据可以被划分为机舱日志数据和传感器采集数据。机舱日志数据是船员在规定时间、按照固定格式手动填写的,不可避免地存在着数据错误;并且采样周期较长,对船舶油耗情况刻画不准确。因此,绝大部分船舶油耗评估模型均使用传感器数据进行建模。随着传感器技术的不断发展,现代船舶上安装有大量的传感器设备,例如多普勒计程仪、气压仪、GPS(GlobalPositionSystem)全球定位系统和自动识别系统AIS(AutomaticIdentificationSystem)等,这些传感器可以准确测量并精确记录油耗相关的船舶状态及环境信息。但是,由于传感器的厂家及制造标准各异,导致传感器采样频率也各不相同。因此,基于传感器的船舶油耗数据可以被视为多源异构数据。在使用这些数据对船舶油耗进行建模之前,必须对其进行特征提取及融合。在已有研究中,Dario和Antonio针对基于传感器的油耗数据做了变量重新定义,例如风向、排水量等。然后对不同的特征进行选择以确保使用恰当的特征进行船舶油耗评估。JianqinZheng和HaoranZheng对油耗数据做了正则化,加速模型的收敛速度和精度。Trodden和Murphy使用卡尔曼滤波器剔除脏数据。Lokuka ...
【技术保护点】
1.一种多源异构油耗数据特征提取及融合方法,其特征在于:包括以下步骤:/nS1、对油耗数据进行预处理/n油耗数据即与油耗相关的传感器数据,油耗数据预处理包括补充缺失值和删除异常值两部分;首先,使用插值法对因传感器故障产生的缺失值进行补充,然后将油耗数据中超出船舶正常操作区域的数据作为异常数据予以剔除;油耗数据包括船舶风速数据、纵倾数据、舵角数据、主机燃油数据、螺距数据、航速数据和吃水数据;/nS2、对预处理后的各类油耗数据进行时域的一致性操作/n时域的一致性操作包括分帧操作和帧移操作;所述分帧操作,即采用等长度的帧长d对时域进行移动分帧;所述帧移操作,即在移动分帧过程中相邻两帧之间具有一定的重叠区域,重叠区域称为帧移,帧移长度取帧长的20%~60%;通过上述操作,保证不同采样频率的传感器数据实现时域上的一致性;/nS3、对各帧数据进行特征提取操作/n根据步骤S2得到的数据,对各帧数据进行特征提取操作,特征提取包括统计特征提取与时间序列特征提取;两种特征的提取过程如下:/nS31、提取统计特征向量/n各帧数据的统计特征包括平均值mean、方差variance、众数mode、中位数medi ...
【技术特征摘要】
1.一种多源异构油耗数据特征提取及融合方法,其特征在于:包括以下步骤:
S1、对油耗数据进行预处理
油耗数据即与油耗相关的传感器数据,油耗数据预处理包括补充缺失值和删除异常值两部分;首先,使用插值法对因传感器故障产生的缺失值进行补充,然后将油耗数据中超出船舶正常操作区域的数据作为异常数据予以剔除;油耗数据包括船舶风速数据、纵倾数据、舵角数据、主机燃油数据、螺距数据、航速数据和吃水数据;
S2、对预处理后的各类油耗数据进行时域的一致性操作
时域的一致性操作包括分帧操作和帧移操作;所述分帧操作,即采用等长度的帧长d对时域进行移动分帧;所述帧移操作,即在移动分帧过程中相邻两帧之间具有一定的重叠区域,重叠区域称为帧移,帧移长度取帧长的20%~60%;通过上述操作,保证不同采样频率的传感器数据实现时域上的一致性;
S3、对各帧数据进行特征提取操作
根据步骤S2得到的数据,对各帧数据进行特征提取操作,特征提取包括统计特征提取与时间序列特征提取;两种特征的提取过程如下:
S31、提取统计特征向量
各帧数据的统计特征包括平均值mean、方差variance、众数mode、中位数median、上边缘max、上四分位点Q3、下四分位点Q1和下边缘min;
考虑各帧数据存在非标准正态分布,提取平均值、方差、众数和中位数作为统计特征向量A;
考虑到各帧数据存在离群数据,提取上边缘、上四分位点、下四分位点和下边缘作为统计特征向量B;
将数据按数值大小排序得到上四分位点Q3和下四分位点Q1;并将上四分位点Q3和下四分位点Q1之间的间隔定义为:
IQR=Q3-Q1
根据排列所得的上四分位点和下四分位点,得到帧内数据的上边缘和下边缘计算公式如下:
Max=Q3...
【专利技术属性】
技术研发人员:左毅,朱永洁,李铁山,马赫,
申请(专利权)人:大连海事大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。