兴趣点数据的处理方法及装置、电子设备、可读介质制造方法及图纸

技术编号:25949061 阅读:27 留言:0更新日期:2020-10-17 03:41
本公开提供了一种待加工兴趣点数据的处理方法,属于计算机技术领域,可用于智能驾驶领域、云计算领域和机器学习领域,该方法包括:从兴趣点数据中识别出兴趣点所属的行业类别;根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;获取兴趣点数据对应的位置区域的兴趣点情报特征;将位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出兴趣点数据对应的位置区域的第二兴趣点新增率评分值;根据第一兴趣点新增率评分值和第二兴趣点新增率评分值,确定出兴趣点数据对应的价值评分值。本公开还提供了处理装置、电子设备及计算机可读介质。

【技术实现步骤摘要】
兴趣点数据的处理方法及装置、电子设备、可读介质
本公开实施例涉及计算机
,特别涉及待加工兴趣点数据的处理方法及装置、电子设备、计算机可读介质。
技术介绍
目前,在通过众包采集等方式获取到海量POI(PointofInformation,兴趣点)图像素材之后,通常需要人工对待加工的POI图像中的POI名称、实际坐标等进行加工,并在加工后上线至电子地图进行显示,以更新电子地图上的POI。
技术实现思路
本公开实施例提供一种待加工兴趣点数据的处理方法及装置、电子设备、计算机可读介质。第一方面,本公开实施例提供一种待加工兴趣点数据的处理方法,该处理方法包括:从待加工兴趣点数据中识别出兴趣点所属的行业类别;根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该待加工兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;获取待加工兴趣点数据对应的位置区域的兴趣点情报特征;将所述位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出待加工兴趣点数据对应的位置区域的第二兴趣点新增率评分值;根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值。在一些实施例中,所述兴趣点数据包括兴趣点图像;所述从待加工兴趣点数据中识别出兴趣点所属的行业类别,包括:从所述兴趣点图像中识别出兴趣点招牌文字信息;根据所述兴趣点招牌文字信息,确定出所述兴趣点所属的行业类别。在一些实施例中,所述从所述兴趣点图像中识别出兴趣点招牌文字信息,包括:通过预设图像文字识别模型,从所述兴趣点图像中识别出兴趣点招牌文字信息。在一些实施例中,所述行业类别与兴趣点新增率评分值的对应关系通过如下步骤设置:对于属于预定义的不易变类型的每一行业类别,根据预定义规则,设置该行业类别对应的兴趣点新增率;对于属于预定义的易变类型的每一行业类别,统计该行业类别的兴趣点新增率,该行业类别的兴趣点新增率为该行业类别在第一预设时间段内的兴趣点新增量与该行业类别当前的兴趣点总量的比值;按照各行业类别对应的兴趣点新增率的大小,对各行业类别进行分类,每一类对应一兴趣点新增率评分值,以得到行业类别与兴趣点新增率评分值的对应关系。在一些实施例中,所述兴趣点数据包括兴趣点图像,所述获取待加工兴趣点数据对应的位置区域的兴趣点情报特征之前,还包括:根据预先在电子地图中对每个城市区域的网格区域划分情况和所述兴趣点图像对应的拍摄位置坐标,确定该拍摄位置坐标所属的网格区域,该网格区域为所述待加工兴趣点数据对应的位置区域。在一些实施例中,所述兴趣点情报特征包括以下特征之一或任意组合:该位置区域内根据快递信息确定出的POI数量;该位置区域内根据竞品特有情报数据确定的POI数量;该位置区域内根据导航情报数据确定出的POI数量;该位置区域内的模糊的POI数量;该位置区域内的预设点击热度范围内的POI数量。在一些实施例中,所述区域新增率打分模型通过以下步骤训练得到:构建数据集,所述数据集包括第二预设时间段内所述电子地图中的每个网格区域的POI新增数据;将所述数据集中的部分数据作为训练样本,另一部分数据作为测试样本;每一训练样本对应一网格区域的POI新增数据,每一测试样本对应一网格区域的POI新增数据;根据所述训练样本确定所述训练样本所对应的类别标签;从所述训练样本中获得每个所述网格区域的用于模型训练的兴趣点情报特征,并从所述测试样本中获得每个所述网格区域的用于模型测试的兴趣点情报特征;对XGBT模型进行模型训练,得到所述区域新增率打分模型,所述区域新增率打分模型的输入为每个网格区域的兴趣点情报特征,输出为每个网格区域的兴趣点新增率评分值。在一些实施例中,所述根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值,包括:根据所述第一兴趣点新增率评分值、所述第二兴趣点新增率评分值和预设的价值评分值公式:S=α*St+β*Sr,计算得到所述待加工兴趣点数据对应的价值评分值;其中,S表示价值评分值,St表示所述第一兴趣点新增率评分值,Sr表示所述第二兴趣点新增率评分值,α为预设的第一兴趣点新增率评分值对应的权重系数,β为预设的第二兴趣点新增率评分值对应的权重系数。第二方面,本公开实施例提供一种待加工兴趣点数据的处理装置,该处理装置包括:类别识别模块,用于从待加工兴趣点数据中识别出兴趣点所属的行业类别;类别新增率评分模块,用于根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该待加工兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;情报特征获取模块,用于获取待加工兴趣点数据对应的位置区域的兴趣点情报特征;区域新增率评分模块,用于将所述位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出待加工兴趣点数据对应的位置区域的第二兴趣点新增率评分值;价值评估模块,用于根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值。在一些实施例中,所述兴趣点数据包括兴趣点图像;所述类别识别模块具体用于从所述兴趣点图像中识别出兴趣点招牌文字信息;根据所述兴趣点招牌文字信息,确定出所述兴趣点所属的行业类别。在一些实施例中,所述类别识别模块具体用于通过预设图像文字识别模型,从所述兴趣点图像中识别出兴趣点招牌文字信息。在一些实施例中,所述兴趣点数据包括兴趣点图像,该装置还包括位置区域确定模块,所述位置区域确定模块用于在所述情报特征获取模块获取待加工兴趣点数据对应的位置区域的兴趣点情报特征之前,根据预先在电子地图中对每个城市区域的网格区域划分情况和所述兴趣点图像对应的拍摄位置坐标,确定该拍摄位置坐标所属的网格区域,该网格区域为所述待加工兴趣点数据对应的位置区域。在一些实施例中,所述兴趣点情报特征包括以下特征之一或任意组合:该位置区域内根据快递信息确定出的POI数量;该位置区域内根据竞品特有情报数据确定的POI数量;该位置区域内根据导航情报数据确定出的POI数量;该位置区域内的模糊的POI数量;该位置区域内的预设点击热度范围内的POI数量。在一些实施例中,所述价值评估模块具体用于根据所述第一兴趣点新增率评分值、所述第二兴趣点新增率评分值和预设的价值评分值公式:S=α*St+β*Sr,计算得到所述待加工兴趣点数据对应的价值评分值;其中,S表示价值评分值,St表示所述第一兴趣点新增率评分值,Sr表示所述第二兴趣点新增率评分值,α为预设的第一兴趣点新增率评分值对应的权重系数,β为预设的第二兴趣点新增率评分值对应的权重系数。第三方面,本公开实施例提供一种电子设备,其包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当所述一个或多个程序被本文档来自技高网...

【技术保护点】
1.一种待加工兴趣点数据的处理方法,包括:/n从待加工兴趣点数据中识别出兴趣点所属的行业类别;/n根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该待加工兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;/n获取待加工兴趣点数据对应的位置区域的兴趣点情报特征;/n将所述位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出待加工兴趣点数据对应的位置区域的第二兴趣点新增率评分值;/n根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值。/n

【技术特征摘要】
1.一种待加工兴趣点数据的处理方法,包括:
从待加工兴趣点数据中识别出兴趣点所属的行业类别;
根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该待加工兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;
获取待加工兴趣点数据对应的位置区域的兴趣点情报特征;
将所述位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出待加工兴趣点数据对应的位置区域的第二兴趣点新增率评分值;
根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值。


2.根据权利要求1所述的处理方法,其中所述兴趣点数据包括兴趣点图像;
所述从待加工兴趣点数据中识别出兴趣点所属的行业类别,包括:
从所述兴趣点图像中识别出兴趣点招牌文字信息;
根据所述兴趣点招牌文字信息,确定出所述兴趣点所属的行业类别。


3.根据权利要求2所述的处理方法,其中所述从所述兴趣点图像中识别出兴趣点招牌文字信息,包括:
通过预设图像文字识别模型,从所述兴趣点图像中识别出兴趣点招牌文字信息。


4.根据权利要求1所述的处理方法,其中所述行业类别与兴趣点新增率评分值的对应关系通过如下步骤设置:
对于属于预定义的不易变类型的每一行业类别,根据预定义规则,设置该行业类别对应的兴趣点新增率;
对于属于预定义的易变类型的每一行业类别,统计该行业类别的兴趣点新增率,该行业类别的兴趣点新增率为该行业类别在第一预设时间段内的兴趣点新增量与该行业类别当前的兴趣点总量的比值;
按照各行业类别对应的兴趣点新增率的大小,对各行业类别进行分类,每一类对应一兴趣点新增率评分值,以得到行业类别与兴趣点新增率评分值的对应关系。


5.根据权利要求1所述的处理方法,其中所述兴趣点数据包括兴趣点图像,所述获取待加工兴趣点数据对应的位置区域的兴趣点情报特征之前,还包括:
根据预先在电子地图中对每个城市区域的网格区域划分情况和所述兴趣点图像对应的拍摄位置坐标,确定该拍摄位置坐标所属的网格区域,该网格区域为所述待加工兴趣点数据对应的位置区域。


6.根据权利要求5所述的处理方法,其中所述兴趣点情报特征包括以下特征之一或任意组合:该位置区域内根据快递信息确定出的POI数量;该位置区域内根据竞品特有情报数据确定的POI数量;该位置区域内根据导航情报数据确定出的POI数量;该位置区域内的模糊的POI数量;该位置区域内的预设点击热度范围内的POI数量。


7.根据权利要求6所述的处理方法,其中所述区域新增率打分模型通过以下步骤训练得到:
构建数据集,所述数据集包括第二预设时间段内所述电子地图中的每个网格区域的POI新增数据;
将所述数据集中的部分数据作为训练样本,另一部分数据作为测试样本;每一训练样本对应一网格区域的POI新增数据,每一测试样本对应一网格区域的POI新增数据;
根据所述训练样本确定所述训练样本所对应的类别标签;
从所述训练样本中获得每个所述网格区域的用于模型训练的兴趣点情报特征,并从所述测试样本中获得每个所述网格区域的用于模型测试的兴趣点情报特征;
对XGBT模型进行模型训练,得到所述区域新增率打分模型,所述区域新增率打分模型的输入为每个网格区域的兴趣点情报特征,输出为每个网格区域的兴趣点新增率评分值。


8.根据权利要求1所述的处理方法,其中所述根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待...

【专利技术属性】
技术研发人员:吴箫
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1