一种地标信息确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36707043 阅读:19 留言:0更新日期:2023-03-01 09:30
本发明专利技术实施例公开了一种地标信息确定方法、装置、电子设备和存储介质。该方法包括:获取至少一个组合关键词,组合关键词包括第一关键词和第二关键词,第一关键词用于表示城市名称,第二关键词为任一名词;分别对每个组合关键词进行数据抓取,确定每个组合关键词对应的文本信息;根据文本信息,确定地标信息,地标信息包括与城市名称相关的名词所在的地点名称、地址信息和网际互连协议IP信息。本发明专利技术实施例通过对组合关键词进行数据抓取,确定抓取后的文本信息,从而根据文本信息确定地标信息,解决了地标定位精度低且数据挖掘数量有限的问题,提升了地标信息确定的精确度。提升了地标信息确定的精确度。提升了地标信息确定的精确度。

【技术实现步骤摘要】
一种地标信息确定方法、装置、电子设备和存储介质


[0001]本专利技术涉及数据挖掘
,尤其涉及一种地标信息确定方法、装置、电子设备和存储介质。

技术介绍

[0002]互联网可以简单理解为若干台设备连接组合的一个大的网状平台,给人们带来便利的同时也会发生大量的网络攻击行为。
[0003]在网络被攻击时,网络技术人员需要对发生异常的位置进行快速定位。目前,现有技术通常会使用第三方数据库查询发生异常的位置,但第三方数据库的准确性较低,许多结果都是精确到城市级别而并非街道级别。具体的,现有的基于全球广域网(World Wide Web,Web)地图的网络实体地标自动挖掘方法,依据第三方接口进行数据挖掘,存在地标数量有限的问题;还有基于因特网Internet论坛的网络实体城市级地标挖掘算法仅仅通过论坛进行分析,获取信息有限,且存在获取的页面中的网际互连协议(Internet Protocol,IP)地址的定位精度仅限于城市级别,无法定位到街道级别的问题。

技术实现思路

[0004]本专利技术提供了一种地标信息确定方法、装置、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种地标信息确定方法,其特征在于,该方法包括:获取至少一个组合关键词,所述组合关键词包括第一关键词和第二关键词,所述第一关键词用于表示城市名称,所述第二关键词为任一名词;分别对每个所述组合关键词进行数据抓取,确定每个所述组合关键词对应的文本信息;根据所述文本信息,确定地标信息,所述地标信息包括与所述城市名称相关的所述名词所在的地点名称、地址信息和网际互连协议IP信息。2.根据权利要求1所述的方法,其特征在于,所述获取至少一个组合关键词,包括:获取第一集合和第二集合,所述第一集合包括多个所述第一关键词,所述第二集合包括多个所述第二关键词;分别从所述第一集合和所述第二集合中选择任意数量个所述第一关键词和所述第二关键词,生成至少一个所述组合关键词。3.根据权利要求1所述的方法,其特征在于,对于任一所述组合关键词,所述对所述组合关键词进行数据抓取,确定所述组合关键词对应的文本信息,包括:判断所述组合关键词的主题是否明确;若所述组合关键词的主题明确,则获取所述组合关键词的统一资源定位系统URL,并基于第一搜索引擎搜索所述组合关键词的URL,得到第一下载页面;根据所述第一下载页面,提取所述组合关键词对应的文本信息;若所述组合关键词的主题不明确,则基于第二搜索引擎搜索所述组合关键词,得到第二下载页面;根据所述第二下载页面,提取所述组合关键词对应的文本信息。4.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息,确定地标信息,包括:根据预设规则,从所述文本信息中提取所述IP信息;根据第三方接口,查询所述IP信息对应的所述地点名称和所述地址信息。5.根据权利要求1所述的方法,其特征在于,在确定地标信息后,还包括:根据开源定位数据库,确定所述IP信息对应的第一经纬度信息;确定所述第一经纬度信息和所述地址信息的第一相似度是否小于第一阈值;若所述第一相似度小于所述第一阈值,则丢弃...

【专利技术属性】
技术研发人员:栾吉海刘佳欣魏依鹤李娟宋志刚
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1