基于人员画像个性化算法制造技术

技术编号:29436350 阅读:14 留言:0更新日期:2021-07-27 16:43
本发明专利技术公开了一种基于人员画像个性化算法,包括以下步骤:S1,获取当前时刻的环境信息和车辆的当前状态信息;S21,在当前时刻的环境下,当车辆的历史操作记录的数据量小于阈值,将车辆的历史操作记录发送至内部存储并训练好的驾驶员风格分类器,所述驾驶员风格分类器识别所述驾驶员风格并发送至决策模块;S22,在当前时刻的环境下,当车辆的历史操作记录的数据量大于阈值;将车辆的历史操作记录发送至处理器,处理器搭建深度学习推荐模型。本发明专利技术的主要目的在于提供一种基于人员画像个性化算法,建立完全符合用户驾驶习惯和驾驶偏好的自动驾驶算法,同时在控制算法并未训练好之前,提高控制算法训练初期驾驶体验和智能化程度。

【技术实现步骤摘要】
基于人员画像个性化算法
本专利技术涉及自动驾驶
,尤其涉及一种基于人员画像个性化算法。
技术介绍
自动驾驶技术是汽车工业史上的一次大变革,装备了自动驾驶设备的汽车具备了“聪明的大脑”,可以在行驶过程中自主做出适当的驾驶行为。近年来,美、欧、日等发达国家和地区将自动驾驶作为交通未来发展的重要方向,在技术研发、道路测试、标准法规、政策等方面为自动驾驶及其载体——智能网联汽车的发展提供政策支持,加快自动驾驶商业化进程。然而,现阶段自动驾驶个性化驾驶程度较低,一般都是根据用户驾驶车辆的行为将用户驾驶风格进行分类,从而根据驾驶风格实行自动化驾驶,但是,一方面,仅仅将用户机械化的划分为某种特定的驾驶风格进行自动化驾驶,将会导致个性化程度较低,不能完全贴合用户的驾驶习惯和驾驶偏好,另外一方面,要完全贴合用户的驾驶习惯和驾驶偏好,需要大量的训练样本进行训练,将会导致控制算法训练初期的驾驶体验和智能化程度较差。
技术实现思路
本专利技术的主要目的在于提供一种基于人员画像个性化算法,建立完全符合用户驾驶习惯和驾驶偏好的自动驾驶算法,同时在控制算法并未训练好之前,采用用户风格划分的方式,针对驾驶风格来进行自动驾驶,提高控制算法训练初期驾驶体验和智能化程度。本申请的提出了一种基于人员画像个性化算法,包括以下步骤:S1,获取当前时刻的环境信息和车辆的当前状态信息;S21,在当前时刻的环境下,当车辆的历史操作记录的数据量小于阈值,将车辆的历史操作记录发送至内部存储并训练好的驾驶员风格分类器,所述驾驶员风格分类器识别所述驾驶员风格并发送至决策模块,当切换至自动驾驶模式时,决策模块根据驾驶员风格输出控制命令控制车辆自动驾驶;S22,在当前时刻的环境下,当车辆的历史操作记录的数据量大于阈值;将车辆的历史操作记录发送至处理器,处理器搭建深度学习推荐模型,切换至自动驾驶模式时,决策模块在相同环境下基于深度学习推荐模型输出控制命令控制车辆自动驾驶。优选地,所述处理器搭建深度学习推荐模型包括:对在每个时间点,S22a,将当前场景下,驾驶员加速,减速,转向,超车的驾驶操作分别进行编码,将驾驶操作变为机器可识别的控制向量,S22b,将控制向量输入深度学习推荐模型,经过门限循环单元模型处理层后,进入全连接层,全连接层激活函数softmax函数输出下一时间点每个驾驶操作被执行的概率;S22c,将预测过程中输出概率之和最大的多个驾驶操作推荐给处理器,处理器基于用户的交互或者评价函数来将当前环境的驾驶操作输出至决策模块,当切换至自动驾驶模式时,决策模块在相同环境下基于处理器输出控制命令控制车辆自动驾驶。优选地,训练过程中,选择适用于多分类交叉熵损失作为损失函数,其计算公式如下:其中,N代表驾驶员的N种驾驶样本,表示第n个样本是否属于第i个类别,取值为0或1,i种类别分别包括加速,减速,转向,超车四种驾驶操作类型,表示输出的结果,训练模型时,输入为用户历史操作类型的前K-1个历史操作记录,输出为操作类型的第2至k个,K的取值由当前操作类型的操作次数来决定。优选地,所述S22c,将预测过程中输出概率之和最大的多个驾驶操作推荐给处理器,处理器基于用户的交互或者评价函数来将当前环境的驾驶操作输出至决策模块,具体包括:用户通过语音交互的方式选择当前环境下的驾驶操作,或者,所述评价函数为:P=Nrs/N,R=N/Nr;P为推荐操作准确的概率,R为驾驶操作召回的概率,N为历史操作记录的数据量,Nrs为当前环境下驾驶操作被驾驶员执行的次数,Nr当前环境下驾驶操作被推荐的次数,F评分技术公式为:2eRP/EP+R为,当评分F大于预设值时,模型训练完成,处理器将当前环境的驾驶操作输出值决策模型。优选地,切换至自动驾驶模式时,决策模块在相同环境下基于深度学习推荐模型输出控制命令控制车辆自动驾驶。具体包括:获取车辆当前时刻的环境图像;将环境图像输入至深度学习推荐模型,得到当前时刻的环境图像对应的驾驶操作的类型和具体参数,决策模块根据驾驶操作的类型和具体参数输出控制命令控制车辆自动驾驶。优选地,所述所述驾驶员风格分类器识别所述驾驶员风格包括:所述驾驶员风格分类器将驾驶员风格发送至决策模块,当切换至自动驾驶模式时,决策模块根据驾驶员风格输出控制命令控制车辆自动驾驶;所述驾驶员风格分类器接收驾驶员习性信息后,根据训练好的驾驶员模型进行初始化辨识,再通过隐马尔可夫算法进行在线辨识得到极大似然值,根据极大似然值判断驾驶员的习性类型。优选地,还包括,当识别所述车辆需要进行避障时,则通过深度强化学习算法进行避碰,其奖励函数为:其中,Di表示车辆与障碍物的最小会遇距离;Ds表示避免发生碰撞的最近距离;kC∈[0,1]表示碰撞影响系数;Ii表示车辆碰撞概率;C表示车辆航向角;dt表示t时刻障碍物平均距离;δ表示车辆偏移车道线的横向角度;ka∈[0,1]表示动作影响系数;V0和VS分别表示车辆当前速度和期望速度;at(C)at(C)表示决策集合中方向变化,at(V)表示决策集合速度变化。本专利技术通过将获取当前时刻获取当前时刻的环境信息和车辆的当前状态信息;在当前时刻的环境下,当车辆的历史操作记录的数据量小于阈值,将车辆的历史操作记录发送至内部存储并训练好的驾驶员风格分类器,所述驾驶员风格分类器将驾驶员风格发送至决策模块,当切换至自动驾驶模式时,决策模块根据驾驶员风格输出控制命令控制车辆自动驾驶,另外,具体的驾驶风格包括稳健型,激进型和一般型,从而可以使得用户的驾驶习惯和个性化模型没有建立之前,可以通过分类器判定用户的驾驶风格,而从而在自动驾驶过程中,可以直接采用与用户的驾驶风格匹配的驾驶风格进行自动驾驶,而不考虑具体的驾驶环境和具体的驾驶时刻下的个性化驾驶,另外,在搭建深度学习推荐模型时,在当前时刻的环境下,当车辆的历史操作记录的数据量大于阈值;将车辆的历史操作记录发送至处理器,处理器搭建深度学习推荐模型,切换至自动驾驶模式时,决策模块在相同环境下基于深度学习推荐模型输出控制命令控制车辆自动驾驶;从而可以做到不管何时,何地或者何种天气都能针对性进行个性化驾驶,从而使得每个驾驶控制指令都能符合驾驶员的驾驶风格和驾驶个性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本专利技术基于人员画像个性化算法的流程图;图2为本专利技术基于人员画像个性化算法中深度学习推荐模型的训练流程图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有本文档来自技高网...

【技术保护点】
1.一种基于人员画像个性化算法,其特征在于,包括以下步骤:/nS1,获取当前时刻的环境信息和车辆的当前状态信息;/nS21,在当前时刻的环境下,当车辆的历史操作记录的数据量小于阈值,将车辆的历史操作记录发送至内部存储并训练好的驾驶员风格分类器,所述驾驶员风格分类器识别所述驾驶员风格并发送至决策模块,当切换至自动驾驶模式时,决策模块根据驾驶员风格输出控制命令控制车辆自动驾驶;/nS22,在当前时刻的环境下,当车辆的历史操作记录的数据量大于阈值;将车辆的历史操作记录发送至处理器,处理器搭建深度学习推荐模型,切换至自动驾驶模式时,决策模块在相同环境下基于深度学习推荐模型输出控制命令控制车辆自动驾驶。/n

【技术特征摘要】
1.一种基于人员画像个性化算法,其特征在于,包括以下步骤:
S1,获取当前时刻的环境信息和车辆的当前状态信息;
S21,在当前时刻的环境下,当车辆的历史操作记录的数据量小于阈值,将车辆的历史操作记录发送至内部存储并训练好的驾驶员风格分类器,所述驾驶员风格分类器识别所述驾驶员风格并发送至决策模块,当切换至自动驾驶模式时,决策模块根据驾驶员风格输出控制命令控制车辆自动驾驶;
S22,在当前时刻的环境下,当车辆的历史操作记录的数据量大于阈值;将车辆的历史操作记录发送至处理器,处理器搭建深度学习推荐模型,切换至自动驾驶模式时,决策模块在相同环境下基于深度学习推荐模型输出控制命令控制车辆自动驾驶。


2.如权利要求1所述的基于人员画像个性化算法,其特征在于,所述处理器搭建深度学习推荐模型包括:对在每个时间点,S22a,将当前场景下,驾驶员加速,减速,转向,超车的驾驶操作分别进行编码,将驾驶操作变为机器可识别的控制向量,S22b,将控制向量输入深度学习推荐模型,经过门限循环单元模型处理层后,进入全连接层,全连接层激活函数softmax函数输出下一时间点每个驾驶操作被执行的概率;S22c,将预测过程中输出概率之和最大的多个驾驶操作推荐给处理器,处理器基于用户的交互或者评价函数来将当前环境的驾驶操作输出至决策模块,当切换至自动驾驶模式时,决策模块在相同环境下基于处理器输出控制命令控制车辆自动驾驶。


3.如权利要求2所述的基于人员画像个性化算法,其特征在于,训练过程中,选择适用于多分类交叉熵损失作为损失函数,其计算公式如下:其中,N代表驾驶员的N种驾驶样本,表示第n个样本是否属于第i个类别,取值为0或1,i种类别分别包括加速,减速,转向,超车四种驾驶操作类型,表示输出的结果,训练模型时,输入为用户历史操作类型的前K-1个历史操作记录,输出为操作类型的第2至k个,K的取值由当前操作类型的操作次数来决定。


4.如权利要求2所述的基于人员画像个性化算法,其特征在于,所述S22c,将预测过程中输出概率之和最大的多个驾驶操作推荐...

【专利技术属性】
技术研发人员:唐建军
申请(专利权)人:海南华天科创软件开发有限公司
类型:发明
国别省市:海南;46

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1