散粮集装箱物流运输环境异常检测的关键特征识别方法技术

技术编号:30640437 阅读:11 留言:0更新日期:2021-11-04 00:35
本发明专利技术公开了一种散粮集装箱物流运输环境异常检测的关键特征识别方法,首先构建异常识别的数据样本集、关键特征排序集,初始化特征集合指标集;然后构建训练样本集,训练线性分类模型SVM

【技术实现步骤摘要】
散粮集装箱物流运输环境异常检测的关键特征识别方法


[0001]本专利技术涉及特征识别
,主要涉及一种散粮集装箱物流运输环境异常检测的关键特征识别方法。

技术介绍

[0002]“北粮南运”散粮集装箱物流实际业务流程包括购销公司收购散粮后,经集装箱从产地港口运输到销地港口的整个过程。集装箱多式联运综合水路、铁路和公路等多种运输方式,实现各种运输方式间的无缝衔接,提高了运输效率,降低了运输成本。同时集装箱物流对货物包装要求低、安全系数较高,大幅度减少货损。由于散粮的品质在运输过程容易受到运输环境的影响,所以为了实现散粮集装箱物流的全过程追溯,针对在途状态智能感知与异常识别研究具有现实意义,且十分迫切和必要。
[0003]针对散粮被购销公司收购后利用集装箱物流从产地供应商的存储仓库到产地港口到销地港口运输的过程,散粮品质可能会发生变化,所以对集装箱物流运输环境的检测至关重要。集装箱物流运输环境异常主要包括箱内环境和箱外环境。箱内环境是指散粮所处的大气环境,应保证箱内环境在货物要求的范围内。箱外环境是指集装箱所处当地位置的大气环境。
[0004]集装箱多式联运运输方式复杂、物流节点众多、运输距离长,因此影响集装箱物流运输环境的不安全因素多,任何一个因素的异常都可能诱发风险导致散粮品质的下降。为了有效避免集装箱内散粮品质发生下降或者变质,必要对集装箱物流的运输环境状态进行智能感知与异常识别。智能感知是通过收集运输环境相关的感知特征参数来实现的。感知特征的数目越多,对运输环境状态的描述就越具体,越能够保证集装箱物流运输环境状态的可靠性。由于散粮集装箱物流运输过程可能涉及到多种异常状态,包括运输线路异常,箱体完整性异常,运输环境异常,运行状态异常等。影响不同异常类型直接关联的特征是不同的,对于运输环境异常需要从多个直接关联的参数中选取最能反映运输环境异常的“关键特征”作为所选取的特征参数。
[0005]目前,国内外用于物流运输安全评价的方法主要包括定性方法、定量方法和定性定量相结合的方法。当状态特征参数无法量化时采用定性方法,其准确性与分析者的直觉和经验有很大关系,应用效果不好,已逐渐被定量方法取代。然而由于实际中特征参数的选取比较模糊,故完全定量计算也并不现实。识别散粮集装箱物流运输环境异常的“关键特征”在机器学习领域可以看作是一种特征选择问题,即从收集到的与散粮集装箱联运物流相关的多个特征参数中选取最能提现运输环境状态的“关键特征”。目前的特征选择方法主要有:过滤法(Filter):按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征。封装法(Wrapper):根据目标函数(通常是预测效果评分),每次选择若干特征,或者排除若干特征。相对于过滤法方法,封装法方法找到的特征子集分类性能通常更好。
[0006]线性支持向量机递归特征消除(SVM

RFE)是Guyon等人提出的包装器算法。它通过
训练线性SVM模型得到权值向量,并递归地消除得分最低的权值系数对应的特征,重复此过程,直到数据集中的特征只剩一个为止。由于其在微阵列分类中的成功应用,SVM

RFE获得了极大的欢迎,并被公认为最有效的特征选择方法之一。假设线性SVM

RFE方法每次迭代删除得分最低的权值系数对应的特征后,线性SVM模型在剩余特征子集训练得到的分类间隔为A。消除其他任意的特征后线性SVM模型在剩余特征子集训练得到的分类间隔为B。递归特征消除的目标是获得最大化的分类间隔,即A>B,而使用线性SVM

RFE方法得到的A<B,所以线性SVM

RFE的递归特征消除策略并不合理。

技术实现思路

[0007]专利技术目的:针对
技术介绍
中存在的问题,本专利技术提供了一种散粮集装箱物流运输环境异常检测的关键特征识别方法,使用递归特征消除方法每次迭代删除得分最高的权值系数对应的特征,使线性SVM模型在剩余特征子集上训练得到的间隔最大化,同时能够快速识别散粮集装箱物流运输环境状态相关的“关键特征”,并得到所有特征对散粮集装箱物流运输环境状态影响的排名。
[0008]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0009]一种散粮集装箱物流运输环境异常检测的关键特征识别方法,包括以下步骤:
[0010]步骤S1、构建散粮集装箱物流运输环境异常识别的数据样本集X、关键特征排序集r;初始化特征集合指标集s=[1,2,

,d],其中d表示因素特征的总数;数据样本集X如下所示:
[0011][0012]其中x
i
∈R
d
,代表第i个样本对应的d维特征,t
i
∈{

1,1},表示类别,1表示散粮集装箱物流运输环境出现异常,

1表示散粮集装箱物流运输环境处于正常状态;R
d
表示每个样本包含d个特征,N为数据样本的个数;
[0013]步骤S2、构建训练样本集X0;
[0014]从数据样本集X的所有因素特征中选取集合s中的因素特征,构成训练样本集X0如下:
[0015]X0=X(:,s)
[0016]步骤S3、训练线性分类模型SVM

train,得到拉格朗日乘子α;删除训练样本集X0中指标集s第i个指标对应的因素特征,作为所述线性分类模型的输入;
[0017]步骤S4、计算权值向量w如下:
[0018][0019]其中,α
k
为拉郎朗日乘子,x
k
为步骤S3中删除训练样本集X0中指标集s第i个指标对应的因素特征后得到的样本特征集,t
k
为样本的类别标签;
[0020]步骤S5、计算指标集s中第i个指标对应特征的排序系数c(i);
[0021]步骤S6、获取排序系数最大的特征f如下:
[0022]f=argmax(c)
[0023]步骤S7、从s中消除s(f),更新特征集s;
[0024]步骤S8、更新关键特征排序集r如下:
[0025]r=[s(f),r][0026]即:在关键因素特征排序表r的第一个元素之前加入因素特征f在表s中对应的s(f);
[0027]步骤S9、当特征集合指标集s不为空集时,重复上述步骤S2

S8;当特征集合指标集s为空集时,则停止上述迭代过程,输出关键特征排序集r。
[0028]进一步地,步骤S3中训练线性分类模型SVM

train的具体步骤包括:
[0029]步骤S3.1、选取惩罚参数C;
[0030]步骤S3.2、求解二次规划问题,得到拉格朗日乘子α=[α1,

,α
N
][0031][0032][0033]其中,x
i
和x
j
...

【技术保护点】

【技术特征摘要】
1.一种散粮集装箱物流运输环境异常检测的关键特征识别方法,其特征在于,包括以下步骤:步骤S1、构建散粮集装箱物流运输环境异常识别的数据样本集X、关键特征排序集r;初始化特征集合指标集s=[1,2,

,d],其中d表示因素特征的总数;数据样本集X如下所示:其中x
i
∈R
d
,代表第i个样本对应的d维特征,t
i
∈{

1,1},表示类别,1表示散粮集装箱物流运输环境出现异常,

1表示散粮集装箱物流运输环境处于正常状态;R
d
表示每个样本包含d个特征,N为数据样本的个数;步骤S2、构建训练样本集X0;从数据样本集X的所有因素特征中选取集合s中的因素特征,构成训练样本集X0如下:X0=X(:,s)步骤S3、训练线性分类模型SVM

train,得到拉格朗日乘子α;删除训练样本集X0中指标集s第i个指标对应的因素特征,作为所述线性分类模型的输入;步骤S4、计算权值向量w如下:其中,α
k
为拉郎朗日乘子,x
k
为步骤S3中删除训练样本集X0中指标集s第i个指标对应的因素特征后得到的样本特征集,t
k
为样本的类别标签;步骤S5、计算指标集s中第i个指标对应特征的排序系数c(i);步骤S6、获取排...

【专利技术属性】
技术研发人员:曹杰丁晓剑张璐徐彩云杨帆
申请(专利权)人:云境商务智能研究院南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1