一种基于迁移学习的驾驶行为预测方法技术

技术编号:22643338 阅读:73 留言:0更新日期:2019-11-26 16:33
本发明专利技术涉及一种基于迁移学习的驾驶行为预测方法,属于汽车智能交互技术领域。该预测方法包括S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。本发明专利技术实现了驾驶员驾驶行为模型自适应和个性化驾驶行为的准确预测,具有很强的实用性。

A driving behavior prediction method based on Transfer Learning

The invention relates to a driving behavior prediction method based on transfer learning, which belongs to the field of automobile intelligent interaction technology. The prediction method includes S1, which collects the operation information, vehicle status information and surrounding environment information of the target driver; S2, which transfers the stored historical information data of the source driver to the target driver based on the local Proctor analysis method to obtain the data of migration learning; S3, which trains the target driver based on the data of migration learning and the principal component analysis method and the maximum expectation algorithm Driving behavior model; S4, according to the driving behavior model of the target driver, the driving behavior of the target driver is predicted in real time. The invention realizes the self-adaptive driving behavior model of the driver and the accurate prediction of the personalized driving behavior, and has strong practicability.

【技术实现步骤摘要】
一种基于迁移学习的驾驶行为预测方法
本专利技术涉及汽车智能交互
,尤其涉及一种基于迁移学习的驾驶行为预测方法。
技术介绍
随着汽车智能化的起步,人们对于汽车良好的体验需求,使得人们希望汽车越来越懂自己,并且根据自己的状态和需求定制对应的服务内容和辅助驾驶。准确预测驾驶员的驾驶行为,尤其是个性化的驾驶行为,对于为驾驶员提供更人性化的服务和更安全舒适的辅助驾驶有极其重要的作用。现阶段,驾驶员驾驶行为预测方法主要有:基于规则的参数模型预测方法和基于数据的机器学习模型预测方法;这两种识别方法的局限性在于:由于不同驾驶员驾驶行为的差异性,由其他驾驶员驾驶行为建立的模型难以对目标驾驶员的驾驶行为,尤其是个性化的驾驶行为进行准确预测。虽然已有部分驾驶行为模型自适应方法,但这些已有的驾驶行为模型自适应方法均需要在已有其他驾驶员驾驶行为模型上进行参数调整,模型自适应效果有限,同样难以准确预测目标驾驶员驾驶行为,实用性不强。
技术实现思路
鉴于上述的分析,本专利技术旨在提供一种基于迁移学习的驾驶行为预测方法,用以解决现有技术中驾驶员驾驶行为模型自适应效果较差以及驾驶行为预测准确性低,实用性不强的问题。本专利技术的目的主要是通过以下技术方案实现的:本专利技术提供了一种基于迁移学习的驾驶行为预测方法,包括以下步骤:S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。进一步地,所述步骤S2中存储的源驾驶员历史信息数据包括其他驾驶员的操作信息、其他驾驶员驾驶本车时的状态信息和周围环境信息;所述源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据具体包括:找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点;计算其他驾驶员驾驶行为数据到目标驾驶员驾驶行为数据的映射关系;根据所述映射关系将所有的其他驾驶员驾驶行为数据映射到目标驾驶员处。进一步地,所述找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点具体包括:从目标驾驶员处采集的数据中均匀采样得到目标驾驶员驾驶行为数据样本点;根据动态时间规整算法对目标驾驶员驾驶行为数据样本点与所有的其他驾驶员驾驶行为数据进行一一计算,得到与目标驾驶员数据样本点对应的其他驾驶员驾驶行为数据样本点。进一步地,基于所述动态时间规整算法获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点,具体包括:将驾驶员的操作信息、本车状态信息和周围环境信息组成矢量z,目标驾驶员驾驶在时刻j的数据为其他驾驶员作为迁移的数据源在时刻i的数据为若与构成对应点,则将其索引组成一个索引对wl=(i,j);求解所有对应点之间的最小距离得到一个最优的索引对序列通过所述最优的索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点,获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点。进一步地,所述对应点满足以下三个约束条件:连续条件wl+1-wl∈{(1,0),(0,1),(1,1)};边界条件w1=(1,1),wL=(Nso,Nta),其中Nso与Nta分别为源驾驶员数据与目标驾驶员数据数量;单调性条件wl=(i,j),wl′=(i′,j′),若l′≥l则i′≥i且j′≥j;所述求解所有对应点之间的最小距离得到一个最优的索引对序列的公式如下:进一步地,基于局部普氏分析法的不同驾驶员间数据的迁移学习具体包括:通过所述动态时间规整算法获得与目标驾驶员数据样本点对应的源驾驶员数据样本点基于高斯混合模型对目标驾驶员数据样本点聚类,将目标驾驶员数据样本点分为K部分并通过所述动态时间规整算法获得的样本点对应关系,将源驾驶员数据样本点相应地分为K部分对于每一部分样本点寻找一个最优映射矩阵使得映射后的源驾驶员数据样本与目标驾驶员数据样本最接近,矩阵公式如下:其中,与分别为源驾驶员数据样本和目标驾驶员数据样本第k部分的协方差矩阵。进一步地,所述目标驾驶员驾驶行为模型的建立过程包括:通过主成分分析提取当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息,得到当前时刻状态信息低维度的特征量s作为模型输入量;将下一时刻的驾驶员操作信息a作为模型输出量;将当前时刻状态量与下一时刻驾驶员操作信息组合为训练数据x=[s,a]T;训练高斯混合模型通过最大期望算法训练得到模型,公式如下:其中,K为模型的预设参数;N表示多维高斯分布,共有K个高斯成分;πk,与为训练得到的模型参数,分别表示第k个高斯成分的权重,均值,向量和协方差矩阵。进一步地,根据所述目标驾驶员驾驶行为模型,结合目标驾驶员驾驶时实时采集的驾驶员操作信息、本车状态信息和周围环境信息,对下一时刻目标驾驶员的操作信息进行预测,具体包括:当目标驾驶员驾驶车辆时,实时采集驾驶员驾驶行为信息,通过所述建模过程中的主成分分析得到的特征提取参数,将实时驾驶员驾驶行为信息提取为与建模过程中相同维度的实时状态信息;通过对当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息进行降维和特征提取,当前的实时数据被处理为驾驶员驾驶行为模型的输入量,预测下一时刻目标驾驶员的驾驶行为。进一步地,所述建模过程中的主成分分析提取参数的特征信息具体包括:根据采集的目标驾驶员驾驶行为数据dt(t=1…N)计算协方差矩阵:其中,N是数据矢量的数量,为均值矢量,由计算得到;对所述协方差矩阵进行特征值分解的公式如下:Σui=λiui;其中,ui与λi分别是相对应的第i个特征向量与特征值;在特征值中选择最大的D个特征值,并降序排列为λ1,λ2,…,λD,其对应的特征向量按同样的顺序组成矩阵U=[u1,u2,…,uD]T;所提取的特征信息矢量由公式得到。进一步地,所述驾驶员驾驶行为模型预测过程,具体包括:实时采集驾驶员的操作信息、本车状态信息和周围环境信息z′;将实时采集的信息经过与建模过程中相同的降维过程,处理为当前时刻状态向量s′;将当前时刻状态向量作为模型输入,通过高斯混合回归过程预测得到下一时刻驾驶员驾驶行为量所述高斯混合回归过程,具体包括:将模型建立过程中训练得到的高斯混合模型参数与按照模型输入s的维度和模型输出a的维度拆分为分块矩阵:依据当前时刻的状态s′,按照如下公式计算高斯混合模型中每一个高斯成分的预测量加权平均值,预测下一时刻驾驶员驾驶行为量:其中,表示第k个高斯成分的预测量;表示当前时刻的状态量s′处于第k个高斯成分的概率。本技术方案的有益效果如下:本专利技术公开了一种基于迁移学习的驾驶行为预测方法,通过充足的其他驾驶员驾驶行为数据,结合目标驾驶员的操作信息、本车状态信息本文档来自技高网...

【技术保护点】
1.一种基于迁移学习的驾驶行为预测方法,其特征在于,包括以下步骤:/nS1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;/nS2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;/nS3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;/nS4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。/n

【技术特征摘要】
1.一种基于迁移学习的驾驶行为预测方法,其特征在于,包括以下步骤:
S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;
S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;
S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;
S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。


2.根据权利要求1所述的方法,其特征在于,所述步骤S2中存储的源驾驶员历史信息数据包括其他驾驶员的操作信息、其他驾驶员驾驶本车时的状态信息和周围环境信息;
所述源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据具体包括:找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点;计算其他驾驶员驾驶行为数据到目标驾驶员驾驶行为数据的映射关系;根据所述映射关系将所有的其他驾驶员驾驶行为数据映射到目标驾驶员处。


3.根据权利要求2所述的方法,其特征在于,所述找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点具体包括:从目标驾驶员处采集的数据中均匀采样得到目标驾驶员驾驶行为数据样本点;根据动态时间规整算法对目标驾驶员驾驶行为数据样本点与所有的其他驾驶员驾驶行为数据进行一一计算,得到与目标驾驶员数据样本点对应的其他驾驶员驾驶行为数据样本点。


4.根据权利要求3所述的方法,其特征在于,基于所述动态时间规整算法获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点,具体包括:将驾驶员的操作信息、本车状态信息和周围环境信息组成矢量z,目标驾驶员驾驶在时刻j的数据为其他驾驶员作为迁移的数据源在时刻i的数据为若与构成对应点,则将其索引组成一个索引对wl=(i,j);
求解所有对应点之间的最小距离得到一个最优的索引对序列通过所述最优的索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点,获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点。


5.根据权利要求4所述的方法,其特征在于,所述对应点满足以下三个约束条件:
连续条件wl+1-wl∈{(1,0),(0,1),(1,1)};
边界条件w1=(1,1),wL=(Nso,Nta),其中Nso与Nta分别为源驾驶员数据与目标驾驶员数据数量;
单调性条件wl=(i,j),wl′=(i′,j′),若l′≥l则i′≥i且j′≥j;
所述求解所有对应点之间的最小距离得到一个最优的索引对序列的公式如下:





6.根据权利要求1或4所述的方法,其特征在于,基于局部普氏分析法的不同驾驶员间数据的迁移学习具体包括:通过所述动态时间规整算法获得与目标驾驶员数据样本点对应的源驾驶员数据样本点
基于高斯混合模型对目标驾驶员数据样本点聚类,将目标驾驶员数据样本点分为K部分并通过所述动态时间规整算法获得的样本点对应关系,将源驾驶员数据样本点相应地分为K部分
对于每一部分样本点寻找一个最优映射矩阵使得映射后的源驾驶员数...

【专利技术属性】
技术研发人员:吕超胡风青陆军琰徐优志龚建伟
申请(专利权)人:北京理工大学上海汽车集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利