提取POI名称的方法、装置、设备和计算机存储介质制造方法及图纸

技术编号:27773051 阅读:43 留言:0更新日期:2021-03-23 12:57
本公开公开了一种提取POI(兴趣点)名称的方法、装置、设备和计算机存储介质,涉及大数据技术领域。具体实现方案为:从POI的图像数据中检测属于同一招牌的各单字区域;对各单字区域进行文字识别,得到各单字区域对应的至少一个候选文字;利用已有的POI名称库,从文字序列集合中确定作为POI名称的概率最大的文字序列,其中各文字序列由各单字区域对应的候选文字按照各单字区域在所述招牌中的顺序组合得到;由确定出的文字序列得到所述招牌对应的POI名称。本申请能够实现POI名称的自动提取,降低人力成本。

【技术实现步骤摘要】
提取POI名称的方法、装置、设备和计算机存储介质
本公开涉及计算机
,特别涉及一种大数据领域中提取POI名称的方法、装置、设备和计算机存储介质。
技术介绍
POI(PointofInterest)指的是兴趣点,是地理信息系统中的一个术语,泛指一切可以抽象为点的地理对象,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站、一所学校、一个医院,等等。POI的主要用途是对事物或事件的位置进行描述,从而增强对事物或事件位置的描述能力和查询能力。在互联网地图类应用中,POI扮演了非常重要的角色。通过使用POI,用户可以在地图中方便地找到感兴趣的地点以及到达该地点的路线。因此如何准确地挖掘出POI是一项非常重要的工作。作为一种较为常用的方式,可以通过采集图像数据,例如街景图像等,从采集的图像数据中提取POI的名称,并结合采集地点,从而建立POI名称和位置之间的关联关系。其中在从采集的图像数据中提取POI名称时,现有技术往往对图像数据进行文字识别并结合人工审核和标注的方式来确定POI名称。显然这种方式需要花费大量的人力,成本较高,数据更新本文档来自技高网...

【技术保护点】
1.一种提取POI名称的方法,包括:/n从POI的图像数据中检测属于同一招牌的各单字区域;/n对各单字区域进行文字识别,得到各单字区域对应的至少一个候选文字;/n利用已有的POI名称库,从文字序列集合中确定作为POI名称的概率最大的文字序列,其中各文字序列由各单字区域对应的候选文字按照各单字区域在所述招牌中的顺序组合得到;/n由确定出的文字序列得到所述招牌对应的POI名称。/n

【技术特征摘要】
1.一种提取POI名称的方法,包括:
从POI的图像数据中检测属于同一招牌的各单字区域;
对各单字区域进行文字识别,得到各单字区域对应的至少一个候选文字;
利用已有的POI名称库,从文字序列集合中确定作为POI名称的概率最大的文字序列,其中各文字序列由各单字区域对应的候选文字按照各单字区域在所述招牌中的顺序组合得到;
由确定出的文字序列得到所述招牌对应的POI名称。


2.根据权利要求1所述的方法,其中,所述从POI的图像数据中检测属于同一招牌的各单字区域包括:
对所述POI的图像数据进行招牌检测,确定至少一个招牌区域;
分别对各招牌区域进行单字区域检测,确定各招牌区域中的各单字区域。


3.根据权利要求1所述的方法,其中,所述从POI的图像数据中检测属于同一招牌的各单字区域包括:
对所述POI的图像数据进行单字检测,确定所述POI的图像数据中的各单字区域;
对所述POI的图像数据进行招牌检测,确定所述POI的图像数据中的各招牌区域;
确定属于同一招牌区域的各单字区域。


4.根据权利要求1所述的方法,其中,所述从POI的图像数据中检测属于同一招牌的各单字区域包括:
将所述POI的图像数据输入预先训练得到的区域检测模型,利用所述区域检测模型的输出确定所述POI的图像数据中的各招牌区域和各单字区域;
确定属于同一招牌区域的各单字区域。


5.根据权利要求4所述的方法,其中,所述区域检测模型采用如下方式预先训练得到:
获取训练数据,所述训练数据包括样本POI图像数据以及对所述样本POI图像数据标注的招牌区域信息和各单字区域信息;
将所述样本POI图像数据作为区域检测模型的输入,将标注的招牌区域信息和各单字区域信息作为所述区域检测模型的目标输出,训练所述区域检测模型。


6.根据权利要求4所述的方法,其中,所述区域检测模型包括:特征提取网络、招牌分类网络、招牌回归网络和文字分类网络;其中,
所述特征提取网络,用于从输入的图像数据中提取各像素的特征表示;
所述招牌回归网络,用于利用所述各像素的特征表示,输出招牌框的位置信息;
所述招牌分类网络,用于利用所述各像素的特征表示进行分类,输出所述招牌框是否为招牌区域的分类结果;
所述文字分类网络,用于利用所述各像素的特征表示,输出各像素是否属于文字区域的分类结果。


7.根据权利要求4所述的方法,其中,所述区域检测模型包括:特征提取网络、候选区域筛选层、区域裁剪层、招牌分类网络、招牌回归网络和文字分类网络;其中,
所述特征提取网络,用于从输入的图像数据中提取各像素的特征表示;
所述候选区域筛选层,用于依据各像素的特征表示对各像素进行排序,依据排序结果初步筛选候选招牌区域;
所述区域剪裁层,用于对所述候选招牌区域进行剪裁;
所述招牌回归网络,用于利用剪裁出的各候选招牌区域中各像素的特征表示,输出招牌框的位置信息;
所述招牌分类网络,用于利用剪裁出的各候选招牌区域中各像素的特征表示进行分类,输出所述招牌框是否为招牌区域的分类结果;
所述文字分类网络,用于利用剪裁出的各候选招牌区域中各像素的特征表示,输出各像素是否属于文字区域的分类结果。


8.根据权利要求6或7所述的方法,其中,利用所述区域检测模型的输出确定所述POI的图像数据中的各招牌区域和各单字区域包括:
利用招牌框的位置信息以及各招牌框是否为招牌区域的分类结果,确定所述POI的图像中的各招牌区域;
利用所述各像素是否属于文字区域的分类结果进行连通域分析,得到各单字区域。


9.根据权利要求1所述的方法,其中,所述对各单字区域进行文字识别,得到各单字区域对应的至少一个候选文字包括:
将单字区域在预先设置的单字图片库中进行匹配,确定与该单字区域的匹配度满足预设要求的单字图片对应的文字作为候选文字;或者,
将单字区域输入文字识别模型,依据所述文字识别模型的识别结果确定该单字区域对应的候选文字,所述文字识别模型基于分类模型预先训练得到。


10.根据权利要求1所述的方法,其中,所述利用已有的POI名称库,从文字序列集合中确定作为POI名称的概率最大的文字序列包括:
依据各单字区域在所述招牌中的顺序形成观测序列;
利用隐马尔可夫模型,确定与所述观测序列最匹配的状态序列;
其中,所述隐马尔可夫模型采用的状态转移概率矩阵依据已有POI名称库进行统计得到,采用的状态矩阵依据各单字区域对应的至少一个候选文字得到。


11.一种提取POI名称的装置,包括:
区域检测单元,用于从POI的图像数据中检测属于同一招牌的各单字区域;
文字识别单元,用于对各单字区域进行文字识别,得到各单字区域对应的至少一个候选文...

【专利技术属性】
技术研发人员:王洪志范淼黄际洲
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1