一种基于迁移学习的空气质量的预测方法及装置制造方法及图纸

技术编号：25044607 阅读：33 留言：0更新日期：2020-07-29 05:34

本发明专利技术实施例提供了一种基于迁移学习的空气质量的预测方法和装置，针对划分目标城市得到的多个第一区域，获取该第一区域在历史时间的影响数据；针对每个第一区域，基于该第一区域的影响数据，以及预先训练得到的多个预测模型中与该第一区域对应的预测模型，获得该第一区域在目标时间的空气质量数据，并将所获得的多个空气质量数据，作为目标城市在目标时间的空气质量数据；其中，任一第一区域对应的预测模型为利用该第一区域的历史空气质量数据，以及与该第一区域的历史空气质量数据对应的历史影响数据，对基于迁移学习获得的多个初始模型中与该第一区域对应的初始模型进行训练得到的。本发明专利技术可以提高空气质量的预测准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于迁移学习的空气质量的预测方法及装置
本专利技术涉及人工智能
，特别涉及一种基于迁移学习的空气质量的预测方法及装置。
技术介绍
近年来，为了方便生活以及生产等等应用场景，对未来的空气质量进行预测变得不可或缺。对此，针对需要预测在目标时间的空气质量的目标城市，可以预先利用目标城市的历史空气质量数据，训练得到预测模型；进而基于目标城市在与目标时间间隔指定时长的历史时间的影响数据以及该预测模型，获得目标城市在目标时间的空气质量数据，从而实现对目标时间的空气质量的预测。其中，目标时间是相对于当前时间的未来的时间；影响数据为能够影响空气质量的数据，例如，城市的天气以及人流量等等数据。相关技术中，历史空气质量数据可以是空气质量监测站监测得到的数据。但是，空气质量监测站较高的建造与维护成本，使得部分城市的空气质量监测站的数量相对而言过少。相应的，该城市的历史空气质量数据十分有限。并且，有限的历史空气质量数据容易导致训练得到的预测模型的参数不够准确；进而造成对该城市空气质量的预测不够准确。可见，如何在历史空气质量数据有限的情况下，提高空气质量的预测准确度，是亟待解决的问题。
技术实现思路
本专利技术实施例的目的在于提供一种基于迁移学习的空气质量的预测方法，以实现在历史空气质量数据有限的情况下，提高空气质量的预测准确度的效果。具体技术方案如下：在本专利技术实施的第一方面，提供了一种基于迁移学习的空气质量的预测方法，所述方法包括：针对划分目标城市得到的多个第...

【技术保护点】
1.一种基于迁移学习的空气质量的预测方法，其特征在于，所述方法包括：/n针对划分目标城市得到的多个第一区域，获取该第一区域在与目标时间间隔指定时长的历史时间的影响数据；其中，所述影响数据为能够影响空气质量的数据；/n针对每个第一区域，基于该第一区域的所述影响数据，以及预先训练得到的多个预测模型中，与该第一区域对应的预测模型，获得该第一区域在所述目标时间的空气质量数据，并将所获得的多个空气质量数据，作为所述目标城市在所述目标时间的空气质量数据；其中，任一第一区域对应的预测模型为利用该第一区域的历史空气质量数据，以及与该第一区域的历史空气质量数据对应的历史影响数据，对基于迁移学习获得的多个初始模型中，与该第一区域对应的初始模型进行训练得到的；/n其中，所述迁移学习包括：针对划分源城市得到的多个第二区域，利用该第二区域的历史空气质量数据，以及与该第二区域的历史空气质量数据对应的历史影响数据，训练得到该第二区域的预测模型，作为与该第二区域匹配的第一区域对应的初始模型；其中，所述每个第二区域的历史空气质量数据的数量大于任一第一区域的历史空气质量数据；所述与该第二区域匹配的第一区域为所述多个第一区...

【技术特征摘要】
1.一种基于迁移学习的空气质量的预测方法，其特征在于，所述方法包括：
针对划分目标城市得到的多个第一区域，获取该第一区域在与目标时间间隔指定时长的历史时间的影响数据；其中，所述影响数据为能够影响空气质量的数据；
针对每个第一区域，基于该第一区域的所述影响数据，以及预先训练得到的多个预测模型中，与该第一区域对应的预测模型，获得该第一区域在所述目标时间的空气质量数据，并将所获得的多个空气质量数据，作为所述目标城市在所述目标时间的空气质量数据；其中，任一第一区域对应的预测模型为利用该第一区域的历史空气质量数据，以及与该第一区域的历史空气质量数据对应的历史影响数据，对基于迁移学习获得的多个初始模型中，与该第一区域对应的初始模型进行训练得到的；
其中，所述迁移学习包括：针对划分源城市得到的多个第二区域，利用该第二区域的历史空气质量数据，以及与该第二区域的历史空气质量数据对应的历史影响数据，训练得到该第二区域的预测模型，作为与该第二区域匹配的第一区域对应的初始模型；其中，所述每个第二区域的历史空气质量数据的数量大于任一第一区域的历史空气质量数据；所述与该第二区域匹配的第一区域为所述多个第一区域中，与该第二区域的空间密度数据之间的相似度，满足预设相似条件的第一区域；任一区域的空间密度数据用于反映该区域中关于城市服务的兴趣点的密集程度。

2.根据权利要求1所述的方法，其特征在于，任一影响数据包括：城市服务数据和城市环境数据；其中，所述城市服务数据为关于实现城市服务所利用的资源的数据；所述城市环境数据为关于城市的自然环境的数据；
针对任一第二区域，该第二区域的预测模型的结构包括：第一神经网络组和第二神经网络组相串联，串联得到的输出与第三神经网络组连接；
其中，所述第一神经网络组，用于利用多个相互连接的第一神经网络，对所述城市服务数据进行特征提取；所述第二神经网络组，用于利用多个相互连接的第二神经网络和填充网络，对所述城市环境数据进行特征提取；所述填充网络用于保证所述第二神经网络组与所述第一神经网络组具有相同维度的输出；所述第三神经网络组用于利用所述串联得到的输出，获得预测结果。

3.根据权利要求1所述的方法，其特征在于，所述针对划分源城市得到的多个第二区域，与该第二区域匹配的第一区域，采用如下步骤确定：
将所述源城市划分为多个指定尺寸的网格，并获取每个网格的空间密度数据，以及每个第一区域的空间密度数据；
针对所述每个网格，分别基于该网格的空间密度数据以及所述每个第一区域的空间密度数据，利用预设相似度模型，获得该网格的多个相似度，并将该网格的多个相似度中最大的相似度对应的第一区域的标识，作为该网格的标识；
获取并基于所述源城市的空气质量监测站的位置数据，对所述源城市的空气质量监测站进行聚类，得到所述源城市的多个第二区域；
分别统计每个第二区域中所述网格的标识的数量，并将数量最多的标识对应的第一区域，作为与该第二区域匹配的第一区域。

4.根据权利要求1所述的方法，其特征在于，所述任一第一区域对应的预测模型的训练目标，包括：
针对任一第一区域，对该第一区域对应的匹配误差和所训练的模型的预测误差之间的加权结果，进行最小化处理；
其中，针对任一第一区域，该第一区域对应的所述匹配误差为基于该第一区域的空间密度数据和相应的第二区域的空间密度数据，计算该第一区域和相应的第二区域之间匹配度的差异值；
针对任一第一区域，该第一区域的所训练的模型的预测误差为该第一区域的所训练的模型的输出数据与该第一区域的历史空气质量数据之间的差异值。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述任一第一区域对应的预测模型的训练过程包括：
任一第一区域对应的客户端获得该第一区域对应的初始模型时，利用该第一区域的历史空气质量数据，以及与该第一区域的历史空气质量数据对应的影响数据，对所述该第一区域对应的初始模型进行训练，得到更新后的模型；
任一第一区域对应的客户端，将该第一区域的更新后的模型发送给中心服务器，以使得所述中心服务器针对每个客户端，基于该客户端对应的权重，对各客户端发送的更新后的模型进行融合，得到该客户端对应的融合后的模型，并判断所述融合后的模型是否满足预设的训练目标，如果满足，将所述融合后的模型和关于结束训练的通知发送给相应的客户端，否则，将所述融合后的模型发送给相应的客户端；
任一第一区域对应的客户端在接收到所述融合后的模型时，利用该第一区域的历史空气质量数据，以及与该第一区域的历史空气质量数据对应的影响数据，对所述融合后的模型进行训练，得到更新后的模型，并执行所述任一第一区域对应的客户端，将该第一区域的更新后的模型发送给中心服务器；
任一第一区域对应的客户端在接收到所述融合后的模型，以及所述关于结束训练的通知时，将所接收的融合后的模型，作为该第一区域对应的预测模型。

6.一种...

【专利技术属性】
技术研发人员：刘亮，马华东，雷田子，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人