一种基于深度学习的互联网问题地图筛查方法技术

技术编号：22308326 阅读：49 留言：0更新日期：2019-10-16 08:25

本发明专利技术公开了一种基于深度学习的互联网问题地图筛查方法，主要包括收集样本库、清洗样本库获得数据集文件、通过深度卷积神经网络算法对数据集文件训练计算获得地图模型、导入地图模型文件对网站图片进行筛查识别判断、标记问题地图并导出。本发明专利技术能够辅助互联网地图监管部门，对海量网络图片进行快速检索，识别地图图片，并判断地图是否合格；营造良好的网络和地图市场环境，切实增强互联网和出版企业国家版图意识和地理信息安全意识，维护国家领土主权、安全和利益。

An Internet problem map screening method based on deep learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的互联网问题地图筛查方法
本专利技术属于图像识别
，具体涉及了一种基于深度学习的互联网问题地图筛查方法。
技术介绍
机器学习通过分析大量数据进行学习，寻找数据中的特征模式并进行预测，数据丰富度的提升和数据量的积累可以不断提高其预测准确性，且在应对复杂情况的数据具有较强的学习能力和包容性。其中，深度学习作为近几年机器学习领域中的一个重要研究内容，已在图像识别、智能搜索、语言处理、智能控制等领域发挥了巨大作用。“问题地图”在互联网中大量存在，特指无审图号标注、错把非国家区域按国家表示、错绘漏绘国界线的地图。规范登载和使用，查处违法违规行为是各级测绘地理信息主管部门职责所在，人工查阅互联网图片是目前开展“问题地图”专项整治的主要方式，工作量大、效率低下，目前尚无一种自动化识别问题地图的方法。
技术实现思路
本专利技术的目的在于针对现有技术中存在的不足，提供了一种基于深度学习的互联网问题地图筛查方法。该方法能够快速识别出不符合地图出版要求的“问题地图”，可批量处理识别网络图片，识别效率高。为了实现上述目的，本专利技术采用了以下技术方案：一种基于深度学习的互联网问题地图筛查方法，主要包括收集样本库、清洗样本库获得数据集文件、对数据集文件训练计算获得地图模型、导入地图模型文件对网站图片进行筛查识别判断、标记问题地图并导出；具体步骤如下：步骤一，收集大量图片样本，然后根据地图绘制法律法规（如《中华人民共和国测绘法》、《地图管理条例》等法律法规）的要求进行整理样本图片，将样本图片重新归为两大类并进行标记：合格的标准地图样本库、不合格的“问题地图”样本库；...

【技术保护点】
1.一种基于深度学习的互联网问题地图筛查方法，其特征在于，包括以下步骤：步骤一，收集大量图片样本，然后根据地图绘制法律法规的要求进行整理样本图片，将样本图片重新归为两大类并进行标记：合格的标准地图样本库、不合格的“问题地图”样本库；步骤二，对步骤一中获得的合格的标准地图样本库和不合格的“问题地图”样本库分别进行清洗，然后将清洗后的合格的标准地图样本库和不合格的“问题地图”样本库分别进行二进制编码压缩成两个数据集文件；所述的清洗步骤包括：1）删除大小小于10KB或图片宽高都小于50像素的图片；2）删除清晰度不高、模糊不清或者水印多的图片；3）将所有剩余图片进行灰度处理、线性拉伸、加入随机噪声；4）将经过步骤3）处理之后的图片进行格式修改，统一为jpg格式；步骤三，将步骤二制作好的数据集文件进行训练计算，即通过深度卷积神经网络算法对数据集文件中的图像矩阵进行卷积计算，得出对应的特征矩阵，通过重复多次卷积计算操作，提取出数据集文件中图像数据的特征信息；将提取出来的特征信息和标记进行对比计算结果精度，并将计算出来的误差值进行反向传播回去调整深度卷积神经网络算法的网络参数，在反复多次计算之后，如...

【技术特征摘要】
1.一种基于深度学习的互联网问题地图筛查方法，其特征在于，包括以下步骤：步骤一，收集大量图片样本，然后根据地图绘制法律法规的要求进行整理样本图片，将样本图片重新归为两大类并进行标记：合格的标准地图样本库、不合格的“问题地图”样本库；步骤二，对步骤一中获得的合格的标准地图样本库和不合格的“问题地图”样本库分别进行清洗，然后将清洗后的合格的标准地图样本库和不合格的“问题地图”样本库分别进行二进制编码压缩成两个数据集文件；所述的清洗步骤包括：1）删除大小小于10KB或图片宽高都小于50像素的图片；2）删除清晰度不高、模糊不清或者水印多的图片；3）将所有剩余图片进行灰度处理、线性拉伸、加入随机噪声；4）将经过步骤3）处理之后的图片进行格式修改，统一为jpg格式；步骤三，将步骤二制作好的数据集文件进行训练计算，即通过深度卷积神经网络算法对数据集文件中的图像矩阵进行卷积计算，得出对应的特征矩阵，通过重复多次卷积计算操作，提取出数据集文件中图像数据的特征信息；将提取出来的特征信息和标记进行对比计算结果精度，并将计算出来的误差值进行反向传播回去调整深度卷积神经网络算法的网络参数，在反复多次计算之后，如果结果精度不再提高，即为达到拟合；拟合之后将深度卷积神经网络算法中所有的网络参数进行保存，保存得到的数据文件即为模型文件，包括标准地图模型和“问题地图”模型；步骤四，按照给定网址检索网站图片，导入步骤三中训练计算得到的模型文件，对该网站图片进行识别判断，具体为：1）将网站图片按照512*512像素规格进行裁切；2）将裁切后的网站图片依次导入resnet残差网络运算；3）提取并导出特征值；即resnet残差网络会根据...

【专利技术属性】
技术研发人员：朱明，刘波，贺雨晴，秦绍峰，林晓媛，何永宁，吴博，廖珊珊，
申请(专利权)人：广西壮族自治区基础地理信息中心，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人