驾驶风险评价模型训练方法及装置制造方法及图纸

技术编号：28321964 阅读：25 留言：0更新日期：2021-05-04 13:02

本申请公开了驾驶风险评价模型训练方法和装置。所述方法包括：获得多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，每组所述驾驶原始数据包含多个数据；对获得的各组驾驶原始数据中的数据进行筛选，分别得到多组已发生事故的驾驶数据和多组未发生事故的驾驶数据，将所述多组已发生事故的驾驶数据和多组未发生事故的驾驶数据作为第一训练数据；利用所述第一训练数据对所述驾驶风险评价模型进行训练。本申请能够训练驾驶风险评价模型，从而对驾驶风险能够进行客观的评价。

全部详细技术资料下载

【技术实现步骤摘要】
驾驶风险评价模型训练方法及装置
本申请涉及交通领域，尤其涉及一种驾驶风险评价模型训练方法及装置。
技术介绍
汽车物联网(简称车联网)是种汽车服务，它使用车辆和道路上的传感设备搜集车辆、道路、环境的信息，实现人、车、路互联互通和信息共享，用户可以在信息网络平台上获取、共享和有效利用涉车信息。汽车远程服务提供商TSP(TelematicsServiceProvider，远距离业务提供商)在Telematics(远距离通信的电信与信息科学)产业链居于核心地位。Telematics服务集合了位置服务、GIS(GeographicInformationSystem或Geo－InformationSystem，地理信息系统)服务和通信服务等现代计算机技术，可以为车主和个人提供导航、娱乐、资讯、安防等强大的服务。随着车联网应用的逐步加深，后装OBD(On-BoardDiagnostic，车载诊断系统)设备和前装集成设备在汽车上的安装，使越来越多的车辆被纳入了信息全程覆盖的范围。汽车作为一个综合的信息服务终端，一方面源源不断地向远程服务器发送车辆各个子系统的运行数据，另一方面从互联网上获取各式各样的信息，包括新闻资讯、音频、视频、基于位置的服务等。汽车的应用中，首要问题就是安全问题。车辆驾驶安全，不仅关系到驾驶员的人身安全，还关系到道路上其他行人车辆的安全，此外，车辆驾驶安全也与某些行业有着直接的经济关系。因此，需要对车辆驾驶安全进行有效科学的评价，以便对驾驶风险采取有效的预防措施。
技术实现思路
>为了解决现有技术中的至少一个问题，本申请实施例提供一种驾驶风险评价模型训练方法及装置。本申请实施例首先提供一种驾驶风险评价模型训练方法，包括：获得多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，每组所述驾驶原始数据包含多个数据；对获得的各组驾驶原始数据中的数据进行筛选，分别得到多组已发生事故的驾驶数据和多组未发生事故的驾驶数据，将所述多组已发生事故的驾驶数据和多组未发生事故的驾驶数据作为第一训练数据；利用所述第一训练数据对所述驾驶风险评价模型进行训练。在一种实施方式中，利用所述第一训练数据对所述驾驶风险评价模型进行训练之前，还包括：对所述第一训练数据进行均衡处理，使得所述第一训练数据中已发生事故的驾驶数据的数据组的数量与未发生事故的驾驶数据的数据组的数量比例处于设定范围内。在一种实施方式中，对所述第一训练数据进行均衡处理，包括下述至少一种：对所述第一训练数据中所述未发生事故的驾驶数据进行随机抽取删除；进行重复抽样，获得新的多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，分别对新获得的各组驾驶原始数据中的数据进行筛选，得到第二训练数据；所述第二训练数据包括多组已发生事故的驾驶数据和多组未发生事故的驾驶数据；将所述第二训练数据中已发生事故的驾驶数据加入所述第一训练数据；对所述第一训练数据中所述已发生事故的驾驶数据进行随机抽取复制。在一种实施方式中，对驾驶原始数据中的数据进行筛选，包括：将所述驾驶原始数据中的各数据作为自变量，将所述驾驶原始数据的事故状况作为因变量，确定所述驾驶原始数据中的各数据与所述事故状况的相关性；所述事故状况为已发生事故或未发生事故；删除所述驾驶原始数据中相关性低于设定值的数据，得到筛选后的驾驶数据。在一种实施方式中，确定所述驾驶原始数据中的数据与所述事故状况的相关性，包括下述至少一种：根据所述数据与所述事故状况的箱式图，确定所述相关性；计算所述数据相对于所述事故状况的证据权重值；根据所述证据权重值，确定所述驾驶数据相对于所述事故状况的信息价值；根据所述信息价值确定所述相关性；根据赤池信息量准则、梯度下降树模型和随机森林算法中的至少一个，确定所述相关性。同时，本申请实施例还提供一种驾驶风险评价模型训练装置，包括：原始数据获得模块：用于获得多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，每组所述驾驶原始数据包含多个数据；原始数据筛选模块：用于对获得的各组驾驶原始数据中的数据进行筛选，分别得到多组已发生事故的驾驶数据和多组未发生事故的驾驶数据，将所述多组已发生事故的驾驶数据和多组未发生事故的驾驶数据作为第一训练数据；训练模块：用于利用所述第一训练数据对所述驾驶风险评价模型进行训练。在一种实施方式中，所述装置还包括：均衡处理模块：用于对所述第一训练数据进行均衡处理，使得所述第一训练数据中已发生事故的驾驶数据的数据组的数量与未发生事故的驾驶数据的数据组的数量比例处于设定范围内。在一种实施方式中，所述均衡处理模块包括下述至少一种：第一均衡单元：用于对所述第一训练数据中所述未发生事故的驾驶数据进行随机抽取删除；第二均衡单元：用于进行重复抽样，获得新的多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，分别对新获得的各组驾驶原始数据中的数据进行筛选，得到第二训练数据；所述第二训练数据包括多组已发生事故的驾驶数据和多组未发生事故的驾驶数据；将所述第二训练数据中已发生事故的驾驶数据加入所述第一训练数据；第三均衡单元：用于对所述第一训练数据中所述已发生事故的驾驶数据进行随机抽取复制。在一种实施方式中，所述原始数据筛选模块包括：相关性单元：用于将所述驾驶原始数据中的各数据作为自变量，将所述驾驶原始数据的事故状况作为因变量，确定所述驾驶原始数据中的各数据与所述事故状况的相关性；所述事故状况为已发生事故或未发生事故；删除单元：用于删除所述驾驶原始数据中相关性低于设定值的数据，得到筛选后的驾驶数据。在一种实施方式中，所述相关性单元包括下述至少一种：箱式图子单元：用于根据所述数据与所述事故状况的箱式图，确定所述相关性；权重值子单元：用于计算所述数据相对于所述事故状况的证据权重值；根据所述证据权重值，确定所述驾驶数据相对于所述事故状况的信息价值；根据所述信息价值确定所述相关性；统计算法子单元：用于根据赤池信息量准则、梯度下降树模型和随机森林算法中的至少一个，确定所述相关性。本申请实施例还提供一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任意一项实施例所提供的方法。本申请实施例还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行本申请任意一项实施例所提供的方法。上述申请中的一个实施例具有如下优点或有益效果：能够对驾驶风险评价模型进行训练，使得能够利用训练好的模型评价驾驶风险。因为采用利用筛选后的数据训练驾驶风险模型的技术手段，所以克服了驾驶风险难以判断的技术问题，进而达到训练驾驶风险评价模型以本文档来自技高网...

【技术保护点】
1.一种驾驶风险评价模型训练方法，其特征在于，包括：/n获得多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，每组所述驾驶原始数据包含多个数据；/n对获得的各组驾驶原始数据中的数据进行筛选，分别得到多组已发生事故的驾驶数据和多组未发生事故的驾驶数据，将所述多组已发生事故的驾驶数据和多组未发生事故的驾驶数据作为第一训练数据；/n利用所述第一训练数据对所述驾驶风险评价模型进行训练。/n

【技术特征摘要】
1.一种驾驶风险评价模型训练方法，其特征在于，包括：
获得多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，每组所述驾驶原始数据包含多个数据；
对获得的各组驾驶原始数据中的数据进行筛选，分别得到多组已发生事故的驾驶数据和多组未发生事故的驾驶数据，将所述多组已发生事故的驾驶数据和多组未发生事故的驾驶数据作为第一训练数据；
利用所述第一训练数据对所述驾驶风险评价模型进行训练。

2.根据权利要求1所述的方法，其特征在于，利用所述第一训练数据对所述驾驶风险评价模型进行训练之前，还包括：
对所述第一训练数据进行均衡处理，使得所述第一训练数据中已发生事故的数据组的数量与未发生事故的驾驶数据的数据组的数量比例处于设定范围内。

3.根据权利要求2所述的方法，其特征在于，对所述第一训练数据进行均衡处理，包括下述至少一种：
对所述第一训练数据中所述未发生事故的驾驶数据进行随机抽取删除；
进行重复抽样，获得新的多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，分别对新获得的各组驾驶原始数据中的数据进行筛选，得到第二训练数据；所述第二训练数据包括多组已发生事故的驾驶数据和多组未发生事故的驾驶数据；将所述第二训练数据中已发生事故的驾驶数据加入所述第一训练数据；
对所述第一训练数据中所述已发生事故的驾驶数据进行随机抽取复制。

4.根据权利要求1所述的方法，其特征在于，对驾驶原始数据中的数据进行筛选，包括：
将所述驾驶原始数据中的各数据作为自变量，将所述驾驶原始数据的事故状况作为因变量，确定所述驾驶原始数据中的各数据与所述事故状况的相关性；所述事故状况为已发生事故或未发生事故；
删除所述驾驶原始数据中相关性低于设定值的数据，得到筛选后的驾驶数据。

5.根据权利要求4所述的方法，其特征在于，确定所述驾驶原始数据中的数据与所述事故状况的相关性，包括下述至少一种：
根据所述数据与所述事故状况的箱式图，确定所述相关性；
计算所述数据相对于所述事故状况的证据权重值；根据所述证据权重值，确定所述驾驶数据相对于所述事故状况的信息价值；根据所述信息价值确定所述相关性；
根据赤池信息量准则、梯度下降树模型和随机森林算法中的至少一个，确定所述相关性。

6.一种驾驶风险评价模型训练装置，其特征在于，包括：
原始数据获得模块：用于获得多组已发生事故的驾驶原始数据和多组未发生事故的驾驶原始数据，每组所述驾驶原始数据包含多个数据；
原始数据筛选模块：用于对获得的各组驾驶原始数据中的数据进行筛选，分别得到多组已发生事...

【专利技术属性】
技术研发人员：黄亮，
申请(专利权)人：彩虹无线北京新技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人