【技术实现步骤摘要】
兴趣点数据的处理方法及装置、电子设备、可读介质
本公开实施例涉及计算机
,特别涉及待加工兴趣点数据的处理方法及装置、电子设备、计算机可读介质。
技术介绍
目前,在通过众包采集等方式获取到海量POI(PointofInformation,兴趣点)图像素材之后,通常需要人工对待加工的POI图像中的POI名称、实际坐标等进行加工,并在加工后上线至电子地图进行显示,以更新电子地图上的POI。
技术实现思路
本公开实施例提供一种待加工兴趣点数据的处理方法及装置、电子设备、计算机可读介质。第一方面,本公开实施例提供一种待加工兴趣点数据的处理方法,该处理方法包括:从待加工兴趣点数据中识别出兴趣点所属的行业类别;根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该待加工兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;获取待加工兴趣点数据对应的位置区域的兴趣点情报特征;将所述位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出待加工兴趣点数据对应的位置区域的第二兴趣点新增率评分值;根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值。在一些实施例中,所述兴趣点数据包括兴趣点图像;所述从待加工兴趣点数据中识别出兴趣点所属的行业类别,包括:从所述兴趣点图像中识别出兴趣点招牌文字信息;根据所述兴趣点招牌文字信息,确定出所述兴趣点所属的行业类别。 ...
【技术保护点】
1.一种待加工兴趣点数据的处理方法,包括:/n从待加工兴趣点数据中识别出兴趣点所属的行业类别;/n根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该待加工兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;/n获取待加工兴趣点数据对应的位置区域的兴趣点情报特征;/n将所述位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出待加工兴趣点数据对应的位置区域的第二兴趣点新增率评分值;/n根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值。/n
【技术特征摘要】
1.一种待加工兴趣点数据的处理方法,包括:
从待加工兴趣点数据中识别出兴趣点所属的行业类别;
根据预设的行业类别与兴趣点新增率评分值的对应关系,确定出该待加工兴趣点数据中兴趣点所属的行业类别所对应的第一兴趣点新增率评分值;
获取待加工兴趣点数据对应的位置区域的兴趣点情报特征;
将所述位置区域的兴趣点情报特征输入预先训练好的区域新增率打分模型,预测出待加工兴趣点数据对应的位置区域的第二兴趣点新增率评分值;
根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待加工兴趣点数据对应的价值评分值。
2.根据权利要求1所述的处理方法,其中所述兴趣点数据包括兴趣点图像;
所述从待加工兴趣点数据中识别出兴趣点所属的行业类别,包括:
从所述兴趣点图像中识别出兴趣点招牌文字信息;
根据所述兴趣点招牌文字信息,确定出所述兴趣点所属的行业类别。
3.根据权利要求2所述的处理方法,其中所述从所述兴趣点图像中识别出兴趣点招牌文字信息,包括:
通过预设图像文字识别模型,从所述兴趣点图像中识别出兴趣点招牌文字信息。
4.根据权利要求1所述的处理方法,其中所述行业类别与兴趣点新增率评分值的对应关系通过如下步骤设置:
对于属于预定义的不易变类型的每一行业类别,根据预定义规则,设置该行业类别对应的兴趣点新增率;
对于属于预定义的易变类型的每一行业类别,统计该行业类别的兴趣点新增率,该行业类别的兴趣点新增率为该行业类别在第一预设时间段内的兴趣点新增量与该行业类别当前的兴趣点总量的比值;
按照各行业类别对应的兴趣点新增率的大小,对各行业类别进行分类,每一类对应一兴趣点新增率评分值,以得到行业类别与兴趣点新增率评分值的对应关系。
5.根据权利要求1所述的处理方法,其中所述兴趣点数据包括兴趣点图像,所述获取待加工兴趣点数据对应的位置区域的兴趣点情报特征之前,还包括:
根据预先在电子地图中对每个城市区域的网格区域划分情况和所述兴趣点图像对应的拍摄位置坐标,确定该拍摄位置坐标所属的网格区域,该网格区域为所述待加工兴趣点数据对应的位置区域。
6.根据权利要求5所述的处理方法,其中所述兴趣点情报特征包括以下特征之一或任意组合:该位置区域内根据快递信息确定出的POI数量;该位置区域内根据竞品特有情报数据确定的POI数量;该位置区域内根据导航情报数据确定出的POI数量;该位置区域内的模糊的POI数量;该位置区域内的预设点击热度范围内的POI数量。
7.根据权利要求6所述的处理方法,其中所述区域新增率打分模型通过以下步骤训练得到:
构建数据集,所述数据集包括第二预设时间段内所述电子地图中的每个网格区域的POI新增数据;
将所述数据集中的部分数据作为训练样本,另一部分数据作为测试样本;每一训练样本对应一网格区域的POI新增数据,每一测试样本对应一网格区域的POI新增数据;
根据所述训练样本确定所述训练样本所对应的类别标签;
从所述训练样本中获得每个所述网格区域的用于模型训练的兴趣点情报特征,并从所述测试样本中获得每个所述网格区域的用于模型测试的兴趣点情报特征;
对XGBT模型进行模型训练,得到所述区域新增率打分模型,所述区域新增率打分模型的输入为每个网格区域的兴趣点情报特征,输出为每个网格区域的兴趣点新增率评分值。
8.根据权利要求1所述的处理方法,其中所述根据所述第一兴趣点新增率评分值和所述第二兴趣点新增率评分值,确定出所述待...
【专利技术属性】
技术研发人员:吴箫,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。