一种航道通告信息智能空间匹配方法及系统技术方案

技术编号:26304580 阅读:92 留言:0更新日期:2020-11-10 20:00
本发明专利技术提供一种航道通告信息智能空间匹配方法及系统,进行航道信息获取,包括获取并存储航道相关信息,所述航道相关信息包括航道通告、计划水深和维护尺度;关键信息提取,包括根据航道相关信息进行中文分词和地理实体识别,进行中文分词时根据航道要素图层构建电子航道图物标名称分词词典作为登录词典,进行地理实体识别时,将航道通告信息中对用户具有实际意义的元素进行划分,构建航道通告的文本语义提取模型,在文本语义提取模型约束下采用BiLSTM‑CRF模型进行训练,并提取关键信息;空间信息可视化,包括基于识别所得标签为地点的地理实体,与电子航道图进行空间匹配,并以空间位置为中心生成地理围栏,标注显示实时的航道通告信息。

【技术实现步骤摘要】
一种航道通告信息智能空间匹配方法及系统
本专利技术涉及空间信息可视化和航道通告智能化领域,尤其是涉及一种航道通告信息智能空间匹配方法及系统。
技术介绍
航道通告信息是航道部门为保障航道畅通安全面向公众发布的周知性内容,通过航道通告内容,船舶可以提前知悉航道的开放、关闭或调整情况,掌握航道中各个水道的开放尺度,从而更好地规划航行路线,尽可能避免由于搁浅、水下障碍物等引起的安全隐患及财产损失。当前航道通告信息多以网站形式进行发布,随着移动互联网技术发展,长江航道测量中心推出了长江航道图APP,并成为长江航道局当前以及今后提供信息服务最重要的途径。在电子航道图上以可视化形式展示航道通告,能让用户在知晓航道通告信息的同时,更加直观、便捷地在电子航道图上定位、浏览、查询通告中的相关内容,如水道、航标、重点通航区域等。但是,如何将时效性强的航道通告信息匹配到电子航道图APP指定位置,提供实时准确的航道信息,是现阶段亟待解决的问题。Python是一种结合了解释性、编译性、互动性,面向对象的跨平台脚本语言,可以通过程序模拟浏览器请求站点行为,把站点返回的HTML代码/JSON数据/二进制数据(图片、视频)爬取到本地,进而提取航道通告信息,这也使得上述问题的解决成为可能。但是,目前数字航道信息化建设中,航道通告信息尚未形成固定的结构化模板,通过Python程序爬取的数据主要以非结构化文本的形式呈现,其内容时效性强、数据量大、涉及航道地名及设施名称众多、专业化程度高。传统匹配方法受技术限制,多采用人工手段进行空间数据与属性数据的关联,耗时费力,难以从海量的航道通告数据中高效提取空间位置信息,而空间位置信息能够大幅提升航道通告数据的使用价值,为航道信息的智能空间匹配打下坚实的基础。因此,本领域亟待提出新的实用技术,以将非结构化的航道通告数据转换成具有空间标识的结构化数据,实现航道通告信息与长江航道图APP或其他实时应用工具中电子航道图的智能空间匹配。
技术实现思路
本专利技术的目的在于,实现基于深度学习的航道通告信息智能空间匹配,提高航道通告信息的实用性、便捷性及空间认知度,并建立稳定的匹配模型。本专利技术的技术方案提供一种航道通告信息智能空间匹配方法,包括以下步骤:步骤1,航道信息获取,包括获取并存储航道相关信息,所述航道相关信息包括航道通告、计划水深和维护尺度;步骤2,关键信息提取,包括根据步骤1所得航道相关信息进行中文分词和地理实体识别;进行中文分词时,根据航道要素图层构建电子航道图物标名称分词词典,以作为登录词典;进行地理实体识别时,将航道通告信息中对用户具有实际意义的元素按照机构O、地点L、主题S、事件E和时间T进行划分,构建航道通告的文本语义提取模型,在文本语义提取模型约束下采用BiLSTM-CRF模型进行训练,并提取关键信息;步骤3,空间信息可视化,包括基于步骤2识别所得标签为地点的地理实体,与电子航道图进行空间匹配,并以空间位置为中心生成地理围栏,标注显示实时的航道通告信息。而且,获取航道相关信息采用聚焦网络爬虫方式实现。而且,爬取页面时,按“重要”、“上游”、“中游”、“下游”的优先级,将过滤后的链接依次放到URL队列中。而且,根据航道要素图层构建电子航道图物标名称分词词典的实现方式如下,步骤1.1,批量加载航道要素图层;步骤1.2,读取要素,根据属性字段来提取要素名称,并将结果保存至已读属性名称列表;步骤1.3,判断当前是否存在未读要素,若是则继续读取要素,返回步骤1.2,若否则结束读取过程并进入步骤1.4;步骤1.4,根据步骤1.2获取的最终名称列表,按照中文分词词典的“名称+换行”格式依次写入文本文件中,并将最终的文件输出作为分词词典。而且,航道通告的文本语义提取模型中,机构O,用于标识航道通告的发布机构;地点L,用于标识航道通告中包含的位置相关信息,包括具有明确空间位置特征的典型航道地物;主题S,用于标识航道通告中包含的主旨性内容,其中包括航道特殊要素对象和航道的运行状态;事件E,用于标识航道通告中具有过程性的内容,包括自然事件和人工事件;时间T,用于标识航道通告的发布时间。而且,在文本语义提取模型约束下采用BiLSTM-CRF模型进行训练,包括使用Bakeoff-3评测中所采用的BIO标注集对文本语义提取模型进行标注,在BiLSTM-CRF模型的CRF层为最后预测的标签添加约束。而且,步骤3的实现包括以下步骤3.1,基于AIS数据或移动端GPS数据,解析获取当前位置经纬度,判断是否位于显示的图幅范围内,若不在则漫游至当前位置所在图幅;步骤3.2,提取航道要素地物中心,包括以当前图幅范围进行叠加分析,获取具有明确空间位置特征的典型航道地物,并计算中心位置;步骤3.3,根据当前移动设备分辨率及步骤3.2获取的中心位置确定缓冲区半径或多边形范围,并依次构建地理围栏;步骤3.4,基于步骤3.3构建的地理围栏来计算是否存在压盖,如果是则调整地理围栏范围或进行偏移处理;步骤3.5,基于步骤3.2获取的地物名称,依次请求获取步骤2所得对应的关键信息;步骤3.6,基于步骤3.2获取的地物中心位置及步骤3.5获取的关键信息,按预设格式组织简化航道通告信息,并在步骤3.4确定的地理围栏范围内进行绘制标注。而且,本专利技术还提供一种航道通告信息智能空间匹配系统,用于执行如上所述的航道通告信息智能空间匹配方法。而且,包括航道信息获取模块(10)、关键信息提取模块(20)及空间信息可视化模块(30),所述航道信息获取模块(10),用于获取并存储航道相关信息,所述航道相关信息包括航道通告、计划水深和维护尺度;所述关键信息提取模块(20),用于根据航道信息获取模块(10)所得航道相关信息进行中文分词和地理实体识别;进行中文分词时,根据航道要素图层构建电子航道图物标名称分词词典,以作为登录词典;进行地理实体识别时,将航道通告信息中对用户具有实际意义的元素按照机构O、地点L、主题S、事件E和时间T进行划分,构建航道通告的文本语义提取模型,在文本语义提取模型约束下采用BiLSTM-CRF模型进行训练,并提取关键信息;所述空间信息可视化模块(30),用于基于关键信息提取模块(20)识别所得标签为地点的地理实体,与电子航道图进行空间匹配,并以空间位置为中心生成地理围栏,标注显示实时的航道通告信息。本专利技术提出通过基于深度学习的航道通告信息智能空间匹配方法,实现航道通告信息的快速匹配。该方法首先利用网络爬虫技术将航道局网站上的航道相关信息爬取并存储,然后对爬取的数据进行智能化处理,包括:中文分词、命名实体识别。最后将识别的命名实体中的地理实体与电子航道图进行匹配,实现航道通告信息的空间可视化。本专利技术利用电子航道图物标名称构建分词词典,较常规词典更能够准确提取航道信息,该方案不仅适用于航道通告的信息要素提取,本文档来自技高网
...

【技术保护点】
1.一种航道通告信息智能空间匹配方法,其特征在于,包括以下步骤:/n步骤1,航道信息获取,包括获取并存储航道相关信息,所述航道相关信息包括航道通告、计划水深和维护尺度;/n步骤2,关键信息提取,包括根据步骤1所得航道相关信息进行中文分词和地理实体识别;进行中文分词时,根据航道要素图层构建电子航道图物标名称分词词典,以作为登录词典;进行地理实体识别时,将航道通告信息中对用户具有实际意义的元素按照机构O、地点L、主题S、事件E和时间T进行划分,构建航道通告的文本语义提取模型,在文本语义提取模型约束下采用BiLSTM-CRF模型进行训练,并提取关键信息;/n步骤3,空间信息可视化,包括基于步骤2识别所得标签为地点的地理实体,与电子航道图进行空间匹配,并以空间位置为中心生成地理围栏,标注显示实时的航道通告信息。/n

【技术特征摘要】
1.一种航道通告信息智能空间匹配方法,其特征在于,包括以下步骤:
步骤1,航道信息获取,包括获取并存储航道相关信息,所述航道相关信息包括航道通告、计划水深和维护尺度;
步骤2,关键信息提取,包括根据步骤1所得航道相关信息进行中文分词和地理实体识别;进行中文分词时,根据航道要素图层构建电子航道图物标名称分词词典,以作为登录词典;进行地理实体识别时,将航道通告信息中对用户具有实际意义的元素按照机构O、地点L、主题S、事件E和时间T进行划分,构建航道通告的文本语义提取模型,在文本语义提取模型约束下采用BiLSTM-CRF模型进行训练,并提取关键信息;
步骤3,空间信息可视化,包括基于步骤2识别所得标签为地点的地理实体,与电子航道图进行空间匹配,并以空间位置为中心生成地理围栏,标注显示实时的航道通告信息。


2.根据权利要求1所述航道通告信息智能空间匹配方法,其特征在于:获取航道相关信息采用聚焦网络爬虫方式实现。


3.根据权利要求2所述航道通告信息智能空间匹配方法,其特征在于:爬取页面时,按“重要”、“上游”、“中游”、“下游”的优先级,将过滤后的链接依次放到URL队列中。


4.根据权利要求1或2或3所述航道通告信息智能空间匹配方法,其特征在于:根据航道要素图层构建电子航道图物标名称分词词典的实现方式如下,
步骤1.1,批量加载航道要素图层;
步骤1.2,读取要素,根据属性字段来提取要素名称,并将结果保存至已读属性名称列表;
步骤1.3,判断当前是否存在未读要素,若是则继续读取要素,返回步骤1.2,若否则结束读取过程并进入步骤1.4;
步骤1.4,根据步骤1.2获取的最终名称列表,按照中文分词词典的“名称+换行”格式依次写入文本文件中,并将最终的文件输出作为分词词典。


5.根据权利要求1或2或3所述航道通告信息智能空间匹配方法,其特征在于:航道通告的文本语义提取模型中,
机构O,用于标识航道通告的发布机构;
地点L,用于标识航道通告中包含的位置相关信息,包括具有明确空间位置特征的典型航道地物;
主题S,用于标识航道通告中包含的主旨性内容,其中包括航道特殊要素对象和航道的运行状态;
事件E,用于标识航道通告中具有过程性的内容,包括自然事件和人工事件;
时间T,用于标识航道通告的发布时间。


6.根据权利要求1或2或3所述航道...

【专利技术属性】
技术研发人员:朱剑华杨保岑何明宪张秋实李赫李莉徐硕周冠男朱楠李伟凡吕霖徐乐李艳芳翁玉张欣熊嘉荔
申请(专利权)人:长江航道测量中心
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1