一种基于AI的可变尺度地质图文本矢量化方法及系统技术方案

技术编号:24853676 阅读:68 留言:0更新日期:2020-07-10 19:07
本发明专利技术提供了一种基于AI的可变尺度地质图文本矢量化方法及系统,其中,方法包括:获取可变尺度格栅地质图,并构建图像素材集合;基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;基于多尺度可分割目标检测算法,对输出的格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;基于词向量表示算法对输出的文本格栅信息进行矢量化识别,输出与文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。提高了地质图文本信息提取的体验。

【技术实现步骤摘要】
一种基于AI的可变尺度地质图文本矢量化方法及系统
本专利技术涉及人工智能
,特别涉及一种基于AI的可变尺度地质图文本矢量化方法及系统。
技术介绍
在地质图领域,由于存在大量的素材,有大量的地理信息,其主要呈现形式又以文本字符为主,图像本身背景复杂、光照与角度多变,加之文本语种繁多、字体尺度方向等多变,最终导致检测与识别精度难以达到应用的需求。而针对格栅地质图的文本信息提取与检索,目前还没有比较系统的方案能够对现有的地质图进行妥善、精确地处理语文本信息提取,普遍都是依靠人力进行查询与操作,也没有一个产品对地质图进行有效的格栅化处理并提取矢量化的文本信息,无法全面和系统的获取到完成对地质图从格栅化到最后文本信息提取的全部处理过程。因此,需要提出基于格栅的文本矢量化检索方法,解决上述问题。
技术实现思路
本专利技术提供一种基于AI的可变尺度地质图文本矢量化方法及系统,用以解决现有技术中图像本身背景复杂、光照与角度多变,加之文本语种繁多、字体尺度方向等多变,而导致检测与识别精度难以达到实际应用的需求的缺陷。...

【技术保护点】
1.一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,包括:/n获取可变尺度格栅地质图,并构建图像素材集合;/n基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;/n基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;/n基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;/n将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。/n

【技术特征摘要】
1.一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,包括:
获取可变尺度格栅地质图,并构建图像素材集合;
基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。


2.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述获取可变尺度格栅地质图,并构建图像素材集合之后包括:
按照预设比例,对所述图像素材集合进行分类处理,获得若干分类子集合;
对不同所述分类子集合中的每张格栅地质图建立与之同名的预设文件,为文本矢量化检索做准备。


3.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像的步骤包括:
根据文本走向水平或者沿同一方向倾斜的格栅地质图,确定第一参考坐标系,并基于倾斜校正方法,对文本走向水平或者沿同一方向倾斜的格栅地质图进行水平校正,并输出;
根据文本走向不一的格栅地质图,动态建立若干个第二参考坐标系,实现对文本走向不一的格栅地质图的动态校正,并输出;
其中,基于所述第一参考坐标系和第二参考坐标系的两个轴向长度,确定所述格栅图像对应的文本区域的分割范围。


4.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息的步骤包括:
基于多尺度可分割目标检测算法,对输出的所述格栅图像进行动态分割;
对动态分割后的所述格栅图像中的格栅文本进行定位,获得所述格栅文本对应的文本区域的中心位置坐标;
基于多尺度可分割目标检测算法输出的长方形区域,将所述中心位置坐标对应的栅格文本的格栅化图像区域与周围背景进行分割;
提取格栅化图像区域中的格栅文本,并输出文本格栅信息。


5.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息的步骤包括:
建立卷积层,获取CNN算法,并提取所述CNN算法中的特征序列标签;
基于提取的特征序列标签,对所述图像素材集合进行特征检测,得到输入的图像特征序列检测结果;
建立循环层,获取双向LSTM算法,并基于卷积层的CNN算法和输入的图像特征序列检测结果,提取所述双向LSTM算法中的特征序列标签的预测结果,获得所述图像素材集合的标签分布,并根据标签分布将...

【专利技术属性】
技术研发人员:高光大王茂发李景朝
申请(专利权)人:中国地质大学北京
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1