【技术实现步骤摘要】
一种基于深度学习的车联网数据建模方法与系统
[0001]本专利技术涉及车联网数据分析的
,尤其涉及一种基于深度学习的车联网数据建模方法与系统。
技术介绍
[0002]车联网作为物联网的重要应用,需要充分挖掘其流数据中的关联关系,例如,交通事故黑点分析(交通事故和时间、地段、天气状况等因素之间的关联关系)等。由于车联网的一个很重要的应用就是通过对各种信息进行加工分析,发现异常情况并进行预警。数据挖掘(DateMining)是指从大量的、不完整的、模糊的、随机的数据中提取出隐含的、先前末知的、并有潜在价值的信息和知识的过程。通过使用数据挖掘技术可以从大量的未筛选的数据中发现有价值的,提供给学习者相关的信息和知识。传统数据挖掘算法是基于统计思想进行检测,其存在的问题是需要事先知道数据的分布特征,但是针对车联网数据量大的特点,不可能对全部的历史数据分析其分布特征;另外,现有车联网系统中,车联网产生的数据流具有实时、连续、快速到达等特点,并且有在线分析的应用需求,随着数据规模不断增大,以及终端采集设备的多样性数据格式的差异性等因 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的车联网数据建模方法,其特征在于,包括:对车联网数据进行数据预处理,将处理完成的数据导入至数据库;利用聚类优化算法对处理后的车联网数据进行聚类,获得数据特征;根据数据特征建立基准模型,并对基准模型进行无监督训练;利用基准模型对数据特征进行挖掘分析,生成关联规则;其中,数据特征包括质量特征、行为特征、参数特征。2.如权利要求1所述的基于深度学习的车联网数据建模方法,其特征在于,所述数据预处理包括:计算车联网数据的缺失比例,将缺失比例小于3%和大于80%的车联网数据进行数据预测,根据预测结果补全缺失数据;对车联网数据进行线性变换,获得第一向量集合;并对第一向量集合进行白化和正则化处理,获得第二向量集合;对第二向量集合进行特征值分解,并将分解结果导入数据库。3.如权利要求2所述的基于深度学习的车联网数据建模方法,其特征在于,所述聚类包括:将数据库的数据输入到第一树模型,获得初始化聚类的簇;其中,所述第一树模型包括多个数据记录单元、至少一个数据记录数组和子节点指针,所述数据记录数组包括至少一个数据记录单元;所述数据记录数组能够监控数据库中的数据分布Q,并将相同维度的同一数据记录单元中,获得初始化聚类的簇;将初始化聚类的簇输入至降噪编码器进行聚类学习;根据软标签概率P和数据分布Q,软标签概率P用于衡量当前数据属于不同簇的概率,通过KL散度损失对降噪编码器的网络参数进行训练,以优化聚类效果;其中,KL散度损失Loss为:Loss=KL(P//Q)。4.如权利要求3所述的基于深度学习的车联网数据建模方法,其特征在于,所述数据特征包括:质量特征:用于评价车联网数据的时间精度、定位精度、数据准确性和采样频率;行为特征:用于描述车联网用户行为的特征信息;参数特征:包括时间戳、观测时间、经纬度、道路信息、位置信息及交通状态。5.如权利要求4所述的基于深度学习的车联网数据建模方法,其特征在于,所述基准模型包括将数据特征输入至网络模型中,网络模型包括BP神经网络模型、岭回归模型、卷积神经网络模型和生成式对抗网络模型,输出预测结果;求取预测结果的平均值,并取整;根据取整结果计算网络模型的均方根误差,并根据均方根误差的阈值滤除过拟合的网络模型,获得基准模型,所述均方根误差的阈值设为0.01。6.如权利要求5所述的基于深度学习的车联网数据建模...
【专利技术属性】
技术研发人员:顾进峰,卢峰,蒋新星,吕清,
申请(专利权)人:南京通力峰达软件科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。