【技术实现步骤摘要】
一种基于语义的地理标注内容安全检查方法及装置
本专利技术属于地理信息
,具体涉及一种对于地理标注内容进行安全检查的方法和装置,尤其是,结合了语义判别与审图规则对地理标注内容进行安全检查的方法和装置。
技术介绍
近年来,随着互联网、云计算、物联网、VGI等新技术的不断发展和日趋成熟,以及人们对地理信息需求越来越强烈,互联网已经成为了地理信息共享、传播和应用的主要平台。网络地理标注(PointofInterest:POI)则是目前最具有代表性的与互联网结合并应用到大众生活中的地理信息产品,其作为一个带位置信息的综合信息,能够通过在地图上直观地标注现实世界的实体及其相关属性,主要包括名称、类别、经度、纬度等信息,为人们的生活带来极大的便利。为了快速抢占这一机遇,谷歌地图、微软地图、雅虎地图、MapABC、MapBar、天地图等众多地理信息服务网站都推出了地理信息查询和用户标注等相关功能。这种地理信息网站信息容量巨大、内容增长迅速、地理信息与位置信息关联度高,已经成为信息社会重要的信息资源发布与交流平台。然而网络地理信息标注在为给人们生活带来巨大方便的同时,地理信息的安全隐患也随之而来。由于地理标注与位置信息关系密切、上传用户的安全意识不高、数据量过于庞大等原因,使得大量涉及国家安全和社会稳定等方面的内容敏感的地理标注信息也出现在网络上,对国家地理信息安全提出了严重威胁和重大挑战。因此,对地理标注内容安全检查技术要求也越来越高、越来越迫切,但目前的地理标注内审审查方法无法满足现实的需求,主要表现在以下几个方面:(1)现阶段地理标注内容审查还需要大量的人工研判 ...
【技术保护点】
一种基于语义的地理标注内容安全检查方法,包括如下步骤:S110,禁用词匹配步骤:构建地理标注内容禁用词库,并利用中文文本匹配方法,有效进行地理标注内容中名称信息和描述信息的关键词匹配与查找,实现基于禁用词库的地理标注涉密内容的自动发现;S120,标注自动分类步骤:针对地理标注的内容、类别及属性,构建地理标注内容分类体系,并针对分类体系中的各个地理信息标注类别,设定语义分类规则和特征向量;然后根据地理标注的名称信息和描述信息,提取地理标注内容的语义特征向量,再利用语义相似度计算方法,实现基于语义的网络地理标注内容的自动分类计算;S130:白名单过滤步骤根据标注自动分类步骤所匹配的部分涉密类型,从该类型中取出相应的白名单对象库,然后根据地理标注的名称信息与白名单对象库中的标注对象名称的相似度计算,通过与设定相似度阈值进行比较,实现白名单过滤功能;S140,地图公开表示规则检查步骤根据相应的规则要求,将其中的各种规则要求进行数字化表达,并利用正向表达式配准及规则匹配等技术,实现地理标注的公开地图内容表示规定检查,确保地理标注内容可公开性。
【技术特征摘要】
1.一种基于语义的地理标注内容安全检查方法,包括如下步骤:S110,禁用词匹配步骤:构建地理标注内容禁用词库,并利用中文文本匹配方法,有效进行地理标注内容中名称信息和描述信息的关键词匹配与查找,实现基于禁用词库的地理标注涉密内容的自动发现;S120,标注自动分类步骤:针对地理标注的内容、类别及属性,构建地理标注内容分类体系,并针对分类体系中的各个地理信息标注类别,设定语义分类规则和特征向量;然后根据地理标注的名称信息和描述信息,提取地理标注内容的语义特征向量,再利用语义相似度计算方法,实现基于语义的网络地理标注内容的自动分类计算;S130:白名单过滤步骤根据标注自动分类步骤所匹配的部分涉密类型,从该类型中取出相应的白名单对象库,然后根据地理标注的名称信息与白名单对象库中的标注对象名称的相似度计算,通过与设定相似度阈值进行比较,实现白名单过滤功能;S140,地图公开表示规则检查步骤根据相应的规则要求,将其中的各种规则要求进行数字化表达,并利用正向表达式配准及规则匹配技术,实现地理标注的公开地图内容表示规定检查,确保地理标注内容可公开性。2.根据权利要求1所述基于语义的地理标注内容安全检查方法,其特征在于:所述禁用词匹配步骤包括如下子步骤:S111:从地理标注内容中提取名称信息和描述信息,融合形成一段描述地理标注内容的文本信息;S112:利用中文文本匹配方法对所述文本信息与所述禁用词库进行关键词匹配;S113:如果匹配成功,说明该地理标注内容中包含涉密信息,则将该地理标注内容收录到质疑地理标注数据库中;否则,进入标注自动分类步骤进行进一步检查。3.根据权利要求1所述基于语义的地理标注内容安全检查方法,其特征在于:所述标注自动分类步骤包括如下子步骤:S121:针对地理标注内容、类别及属性,构建地理标注内容分类体系,并针对分类体系中的各个地理信息标注类别,设定语义分类的分类规则和特征向量;S122:利用文中分词技术,对地理标注的名称信息进行分词处理,将其分为不可再分的词语粒度单元;S123:根据各个分词单元的词性特征,对名称信息进行角色标注,确定各词语在整个名称信息中的地位;S124:根据角色标注选定名称信息的中心词,再利用基于中心词的剪枝算法,剔除不具有实际意义的词语标注;S125:根据各个分词单元离中心词的距离,设置相关语义权重,计算名称信息的语义相似度;S126:通过比较地理标注的名称信息与分类体系中各个类别的相似度值,选择匹配最佳的地理标注类型,进行涉密类型判断,实现基于语义的地理标注内容的自动分类:如果匹配的类型为完全涉密类,则将该地理标注收录到质疑地理标注数据库中;如果匹配的类型为完全公开类,则将该地理标注收录到可公开地理标注数据库中;如果匹配的类型为部分涉密类,则进入白名单过滤步骤继续进行进一步检查。4.根据权利要求1所述基于语义的地理标注内容安全检查方法,其特征在于:所述白名单过滤步骤包括如下子步骤:S131:根据地理标注内容自动分类的结果,即根据标注自动分类步骤所匹配的部分涉密类型,读取该类型相应...
【专利技术属性】
技术研发人员:罗安,刘纪平,王勇,张福浩,王亮,董春,
申请(专利权)人:中国测绘科学研究院,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。