POI分类方法、电子设备及计算机存储介质技术

技术编号:32258536 阅读:16 留言:0更新日期:2022-02-12 19:18
本公开涉及一种POI分类方法、电子设备及计算机存储介质。该方法能够根据预设的词汇库对POI信息的POI名称进行分词,然后根据词汇信息中的POI分类集和词性分类集,从POI分类集和词性分类集两个方面对上述分词后得到的至少一个词汇进行组合,得到至少一个具有语义的短语,然后根据每一短语对应于POI分类集的第二POI分类信息和对应于词性分类集的短语类别,按照至少一个词汇在POI名称中的排列顺序从至少一个词汇的尾词开始向前遍历至少一个短语,获得遍历到的首个POI短语,POI短语的短语类别为POI类别,最后根据首个POI短语的第二POI分类信息,确定POI信息的类别。确定POI信息的类别。确定POI信息的类别。

【技术实现步骤摘要】
POI分类方法、电子设备及计算机存储介质


[0001]本公开实施例涉及电子地图领域,更具体地,涉及一种POI分类方法、电子设备及计算机存储介质。

技术介绍

[0002]兴趣点(Point of Interest,简称POI)是地理信息系统中最基础也是最重要的元素,是将现实中的地标反映到电子地图上的手段。例如,在地理信息系统中,一个POI可以是一个地铁站、一个公交站、一个公园、一栋大楼、一个餐厅、一个酒店或者一个超市等等,每个POI反映在电子地图上都对应一个现实中的地标。每个POI的POI信息包含名称、地址、类别、坐标(例如经纬度)。
[0003]对POI进行分类,可以得到该POI的POI信息的类别(即POI信息中所包含的类别)。POI的POI信息的类别都有相应的行业代码和行业名称,以描述POI对应行业的服务类别信息。例如,POI的POI信息的类别可以是党政机关、餐饮住宿、观光旅游、交通服务、或者商业机构等等。对于具有导航功能的电子地图而言,POI信息的类别对电子地图的检索和前端展示十分重要。例如,对用户展示用户所在位置周边的行业地标,或者根据用户输入的行业信息查找用户所在位置对应的行业地标,能够方便用户快速查找并确定自己想要达到的目的地。
[0004]目前,互联网生活服务类平台都有自己的数据库,其中的数据包括与平台强相关的POI,比如酒店、餐厅、旅游景点等。为了更好地服务大众,这些平台都会和电子导航地图结合,将POI加载到电子地图上,并可以自动更新POI,保证POI的时效性和正确性。这种模式下,可以通过数据挖掘来得到更多实际地标对应的POI。POI是有分类的,例如有一级类和下属于各一级类下的二级类,每个类别都有相应的类别代码和名称对应,方便信息采集的记录和区分。
[0005]实际情况中,通过数据挖掘得到的POI在分类是存在分类准确性偏低的问题,严重影响用户体验。

技术实现思路

[0006]本公开实施例的一个目的是提供一种POI分类的新的技术方案。
[0007]根据本公开的第一方面,提供了一种POI分类方法,包括:根据预设词汇库对POI信息的POI名称进行分词处理,得到分词结果;其中,分词结果包括至少一个词汇和与至少一个词汇一一对应的至少一个词汇信息,词汇信息包括对应于POI分类集的第一POI分类信息和对应于词性分类集的词汇类别,词性分类集包括POI类别;根据至少一个词汇的词汇信息,按照至少一个词汇在POI名称中的排列顺序进行相邻词汇组合,得到至少一个具有语义的短语;其中,任意词汇属于且仅属于至少一个具有语义的短语中的一个短语;获取至少一个具有语义的短语中每一短语对应于POI分类集的第二POI分类信息和对应于词性分类集的短语类别;按照至少一个词汇在POI名称中的排列顺序从至少一个词汇的尾词开始向前
遍历至少一个短语,获得遍历到的首个POI短语;其中,POI短语为短语类别为POI类别的短语;根据首个POI短语的第二POI分类信息,确定POI信息的类别。
[0008]可选地,获取至少一个具有语义的短语中每一短语对应于词性分类集的短语类别,包括:对于每一短语,将对应短语末尾的词汇的词汇类别作为该短语的短语类别。
[0009]可选地,词性分类集还包括区域类别、专有名词类别、分店类别和门点类别;根据至少一个词汇的词汇信息,按照至少一个词汇在POI名称中的排列顺序进行相邻词汇组合,得到至少一个具有语义的短语,包括:将相邻的词汇类别为区域类别的区域词汇进行组合,得到的短语类别为区域类别的区域短语;将相邻的词汇类别为专有名词类别的专有名词和词汇类别为POI类别的POI词汇进行组合,得到短语类别为POI类别的POI短语;将词汇类别为分店类别的分店词汇和位于该分店词汇之前的第一待组合信息进行组合,得到短语类别为分店类别的分店短语;其中,第一待组合信息包括:专有名词或POI短语;将词汇类别为门点类别的门点词汇和位于该门点词汇之前的第二待组合信息进行组合,得到短语类别为门点类别的门点短语;其中,第二待组合信息包括:专有名词或POI短语。
[0010]可选地,词汇类别还包括:道路类别;将相邻的词汇类别为区域类别的区域词汇进行组合,得到的短语类别为区域类别的区域短语之前,该方法还包括:将词汇类别为道路类别的道路词汇和位于该道路词汇之前的区域词汇、门点词汇或者专有名词进行组合,得到短语类别为道路类别的道路短语。
[0011]可选地,将词汇类别为道路类别的道路词汇和位于该道路词汇之前的区域词汇、门点词汇或者专有名词进行组合,得到短语类别为道路类别的道路短语之后,该方法还包括:在道路短语之前的词汇的词汇类别为专有名词或者道路短语之前的短语为POI短语的情况下,将道路短语的短路类别修改为分店类别。
[0012]可选地,专有名词包括:品牌词和/或单字;将相邻的词汇类别为专有名词类别的专有名词和词汇类别为POI类别的POI词汇进行组合,得到短语类别为POI类别的POI短语,包括:将相邻的品牌词和词汇类别为POI类别的POI词汇进行组合,得到短语类别为POI类别的POI短语;和/或,将相邻的单字进行组合,得到词汇类别为专有名词类别的专有名词;将相邻的专有名词和词汇类别为POI类别的POI词汇进行组合,得到短语类别为POI类别的POI短语。
[0013]可选地,将相邻的词汇类别为专有名词类别的专有名词和词汇类别为POI类别的POI词汇进行组合,得到短语类别为POI类别的POI短语之后,该方法还包括:将相邻的POI短语进行组合,得到短语类别为POI类别的POI短语。
[0014]可选地,根据预设词汇库对POI信息的POI名称进行分词处理,得到分词结果之前,该方法还包括:获取多个样本POI信息中每个样本POI信息中的名称和类别;对多个样本POI信息中每个样本POI信息的名称进行分词处理,得到多个样本词汇;根据每个样本词汇对应的样本POI信息的类别确定该样本词汇对应的词汇POI分类信息和词汇类别;为多个样本词汇中的每个样本词汇添加该样本词汇对应的词汇POI分类信息和词汇类别,得到预设词汇库。
[0015]可选地,根据至少一个词汇的词汇信息,按照至少一个词汇在POI名称中的排列顺序进行相邻词汇组合,得到至少一个具有语义的短语之前,该方法还包括:将分词结果输入预设的POI分类模型,获得预设的POI分类模型输出的POI信息的待定类别和该待定类别的
置信度;在置信度大于或等于预设阈值的情况下,确定POI信息的待定类别作为POI信息的类别;在置信度小于预设阈值的情况下,执行按照至少一个词汇在POI名称中的排列顺序进行相邻词汇组合,得到至少一个具有语义的短语及其后续步骤。
[0016]可选地,将分词结果输入预设的POI分类模型之前,该方法还包括:根据预设的卷积神经网络训练n个POI分类样本,得到POI分类模型;n为自然数且n>0;其中,通过如下公式获得预设的卷积神经网络在前向传播过程中的激活函数:σ(z2)=σ(a*W2+b2);其中,σ为激活函数,a为预设的卷积本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种POI分类方法,包括:根据预设词汇库对POI信息的POI名称进行分词处理,得到分词结果;其中,所述分词结果包括至少一个词汇和与所述至少一个词汇一一对应的至少一个词汇信息,所述词汇信息包括对应于POI分类集的第一POI分类信息和对应于词性分类集的词汇类别,所述词性分类集包括POI类别;根据所述至少一个词汇的词汇信息,按照所述至少一个词汇在所述POI名称中的排列顺序进行相邻词汇组合,得到至少一个具有语义的短语;其中,任意词汇属于且仅属于所述至少一个具有语义的短语中的一个短语;获取所述至少一个具有语义的短语中每一短语对应于所述POI分类集的第二POI分类信息和对应于所述词性分类集的短语类别;按照所述至少一个词汇在所述POI名称中的排列顺序从所述至少一个词汇的尾词开始向前遍历所述至少一个短语,获得遍历到的首个POI短语;其中,所述POI短语为短语类别为POI类别的短语;根据所述首个POI短语的第二POI分类信息,确定所述POI信息的类别。2.根据权利要求1所述的POI分类方法,其中,获取所述至少一个具有语义的短语中每一短语对应于所述词性分类集的短语类别,包括:对于每一短语,将对应短语末尾的词汇的词汇类别作为该短语的短语类别。3.根据权利要求1或2所述的POI分类方法,其中,所述词性分类集还包括区域类别、专有名词类别、分店类别和门点类别;所述根据所述至少一个词汇的词汇信息,按照所述至少一个词汇在所述POI名称中的排列顺序进行相邻词汇组合,得到至少一个具有语义的短语,包括:将相邻的词汇类别为区域类别的区域词汇进行组合,得到的短语类别为区域类别的区域短语;将相邻的词汇类别为专有名词类别的专有名词和词汇类别为POI类别的POI词汇进行组合,得到短语类别为POI类别的POI短语;将词汇类别为分店类别的分店词汇和位于该分店词汇之前的第一待组合信息进行组合,得到短语类别为分店类别的分店短语;其中,所述第一待组合信息包括:专有名词或POI短语;将词汇类别为门点类别的门点词汇和位于该门点词汇之前的第二待组合信息进行组合,得到短语类别为门点类别的门点短语;其中,所述第二待组合信息包括:专有名词或POI短语。4.根据权利要求3所述的POI分类方法,其中,所述词汇类别还包括:道路类别;所述将相邻的词汇类别为区域类别的区域词汇进行组合,得到的短语类别为区域类别的区域短语之前,所述方法还包括:将词汇类别为道路类别的道路词汇和位于该道路词汇之前的区域词汇、门点词汇或者专有名词进行组合,得到短语类别为道路类别的道路短语。5.根据权利要求4所述的POI分类方法,其中,所述将词汇类别为道路类别的道路词汇和位于该道路词汇之前的区域词汇、门点词汇或者专有名词进行组合,得到短语类别为道路类别的道路短语之后,所述方法还包括:
在所述道路短语之前的词汇的词汇类别为专有名词或者所述道路短语之前的短语为POI短语的情况下,将所述道路短语的短路类别修改为分店类别。6.根据权利要求3所述的POI分类方法,其中,所述专有名词包括:品牌词和/或单字;所述将相邻的词汇类别为专有名词类别的专有名词和词汇类别为POI类别的POI词汇进行组合,得到...

【专利技术属性】
技术研发人员:陈刚章恩伟樊玉君
申请(专利权)人:易图通科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1