数据预测方法和数据预测装置制造方法及图纸

技术编号：23162293 阅读：21 留言：0更新日期：2020-01-21 22:05

本发明专利技术实施例提出一种数据预测方法和装置，该数据预测方法包括：确定地理平面区域，所述地理平面区域包括多个地理区格，所述多个地理区格的交汇点构成多个预测点，所述地理平面区域中包括多个数据获取点；依据各个数据获取点获得的观测数据，确定与所述各个数据获取点相邻的预测点的数据；对于与所述各个数据获取点不相邻的预测点，基于以所述不相邻的预测点为中心的环绕区域的区域特征数据，利用机器学习模型组件确定所述不相邻的预测点的数据。本发明专利技术利用机器学习模型对地理位置相关的数据进行预测，提高了预测的准确度。

Data prediction method and data prediction device

全部详细技术资料下载

【技术实现步骤摘要】
数据预测方法和数据预测装置
本专利技术涉及信息处理领域，尤其涉及一种数据预测方法和数据预测装置。
技术介绍
在一些地理相关的预测场景中，获取数据是提高预测准确程度的瓶颈。例如，在针对某一个区域的预测中，需要将该区域按照经纬度等方式划分成多个子区域，每一个子区域或者子区域的边界对应一个预测点。预测过程需要从每个预测点采集数据信息。但是如果在每一个预测点均架设一个用于获取数据的数据获取点，则会造成成本的大幅增加。例如，在与地理相关的气象预报的业务场景中，当前所观测到的数据质量直接影响着天气预报的精准度，天气预报是一件非常困难的事情，一个地区未来几小时的天气情况可能不单单跟本地区的指标有关，可能还跟它周边地区当前、过去的指标有关，其地区彼此之间关联性非常强。重要的气象指标一般有降水、风速、湿度、温度、露点温度等，这些基础气象指标是我们进行气象预测的基础，目前只能通过在地面大量架设数据获取点来实时获取。另一方面，随着气象服务精细化的需求，一般要做到“公里”级别的预报，即在相邻1公里的预测点处，需根据自身预测点所观察到的指标数据，给出不同的天气预报结果。在气象传统的认知当中，要想达到这个目的，就必须在每个相邻一公里的预测点处架设数据获取点，但从成本问题的角度来看，这几乎是不可能完成的任务但是，由于架设数据获取点的成本太高，架设有数据获取点的有数据预测点只占所有预测点的5％左右，即绝大多数都是无数据预测点。为了满足每一预测点均有数据的要求，现在业界广泛使用线性插值法获取预测点的数据，即，通过两端有...

【技术保护点】
1.一种数据预测方法，其特征在于，包括：/n确定地理平面区域，所述地理平面区域包括多个地理区格，所述多个地理区格的交汇点构成多个预测点，所述地理平面区域中包括多个数据获取点；/n依据各个数据获取点获得的观测数据，确定与所述各个数据获取点相邻的预测点的数据；/n对于与所述各个数据获取点不相邻的预测点，基于以所述不相邻的预测点为中心的环绕区域的区域特征数据，利用机器学习模型组件确定所述不相邻的预测点的数据。/n

【技术特征摘要】
1.一种数据预测方法，其特征在于，包括：
确定地理平面区域，所述地理平面区域包括多个地理区格，所述多个地理区格的交汇点构成多个预测点，所述地理平面区域中包括多个数据获取点；
依据各个数据获取点获得的观测数据，确定与所述各个数据获取点相邻的预测点的数据；
对于与所述各个数据获取点不相邻的预测点，基于以所述不相邻的预测点为中心的环绕区域的区域特征数据，利用机器学习模型组件确定所述不相邻的预测点的数据。

2.根据权利要求1所述的数据预测方法，其特征在于，依据各个数据获取点获得的观测数据，确定与所述各个数据获取点相邻的预测点的数据的步骤之后，所述方法还包括：
利用与所述多个数据获取点相邻的预测点的历史数据和该预测点周围的多个区域对应的历史区域特征数据，训练所述机器学习模型。

3.根据权利要求1所述的数据预测方法，其特征在于，所述多个预测点是根据地理位置划分形成的预测点。

4.根据权利要求1所述的数据预测方法，其特征在于，所述确定地理平面区域的步骤之后，所述方法还包括：
确定每一预测点对应的相邻范围；
获取该预测点对应的相邻范围内的数据获取点的观测数据。

5.根据权利要求4所述的数据预测方法，其特征在于，所述依据各个数据获取点获得的观测数据，确定与所述各个数据获取点相邻的预测点的数据的步骤包括：
当该预测点对应的相邻范围内存在一个数据获取点时，将所述数据获取点的观测数据作为该预测点的数据；以及
当该预测点对应的相邻范围内存在多个数据获取点时，计算该范围内的多个数据获取点的观测数据的平均值或加权平均值，作为该预测点的预测点数据。

6.根据权利要求4所述的数据预测方法，其特征在于，所述相邻范围为0.5km。

7.根据权利要求1所述的数据预测方法，其特征在于，所述预测点数据包括气象预测数据、海洋渔情预测数据、交通拥堵状况预测数据、人流量密度预测数据其中一种。

8.根据权利要求2所述的数据预测方法，其特征在于，所述利用与所述多个数据获取点相邻的预测点的历史数据和该预测点周围的多个区域对应的历史区域特征数据，训练所述机器学习模型的步骤之前，所述方法还包括：
从多个预测点中选择符合样本要求的有效的预测点。

9.根据权利要求8所述的数据预测方法，其特征在于，所述从多个预测点中选择符合样本要求的有效的预测点的步骤包括：
确定预测点对应的区域中包含数据获取点的区域的数量；
当所述区域的数量符合预设条件时，确认所述预测点为有效的预测点。

10.一种数据预测装置，其特征在于，包括：
确定模块，用于确定地理平面区域，所述地理平面区域包括多个地理区格，所述多个地理区格的交汇点构成多个预测点，所述地理平面区域中包括多个数据获取点；
预测点数据确定模块，用于依据各个数据获取点获得的观测数据，确定与所述各个数据获取点相邻的预测点的数据；
预测点数据计算模块，用于对于与所述各个数据获取点不相邻的预测点，基于以所述不相邻的预测点为中心的环绕区域的区域特征数据，利用机器学习模型组件确定所述不相邻的预测点的数据...

【专利技术属性】
技术研发人员：张柯，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人