【技术实现步骤摘要】
一种POI名称的提取方法、装置、设备及介质
[0001]本说明书涉及计算机
,尤其涉及一种
POI
名称的提取方法
、
装置
、
设备及介质
。
技术介绍
[0002]POI(Point ofInterest)
指的是兴趣点,是地理信息系统中的一个术语,在进行地理信息科学领域是一个重要的概念,可以包含小区
、
店铺
、
学校
、
医院等各类具有一定标志性的地理位置单元
。
是对相关地理信息进行统计汇总和分析的基础,对定位导航
、
区域分析等领域的研究具有重要意义
。POI
的具体名称信息通常难以获取
。
一方面由于地理信息兴趣点没有固定的维护途径,在实际需要使用时无法找到已有的
POI
名录或相关数据库;同时
POI
信息的变化速度也比较快,例如小型店铺的营业状态容易发生变化,因此难以及时统计清楚
。
此外,统一实际地点的名称可能会有多种,这也给
POI
名称获取增加了难度
。
所以,
POI
名称的及时获取,是提高
POI
应用场景使用效果的重要因素
。
[0003]在实际对于
POI
的使用时,往往会以大批量语料为基础进行使用
。
然而以大量批量语料为基础时,传统的分词方法通常 ...
【技术保护点】
【技术特征摘要】
1.
一种
POI
名称的提取方法,其特征在于,所述方法包括:收集批量语料信息构建文本信息库,以对所述文本信息库中各语料信息进行分词编码,获得各语料信息所对应的分词编码;计算各所述分词编码的互信息与临字丰富度,以基于所述互信息与临字丰富度获取各所述语料信息中的待选
POI
名称;将所述待选
POI
名称分别输入第一判别通道与第二判别通道,获取第一判别结果与第二判别结果;其中,所述第一判别通道为机器学习分类模通道,所述第二判别通道为人工经验通道;汇总所述第一判别结果与所述第二判别结果,筛选所述待选
POI
名称中的最终
POI
名称
。2.
根据权利要求1所述的一种
POI
名称的提取方法,其特征在于,收集批量语料信息构建文本信息库,以对所述文本信息库中各语料信息进行分词编码,获得各语料信息所对应的分词编码,具体包括:获取当前应用场景所对应的语料信息获取接口,以基于各所述语料信息获取接口获取预置采集周期内的语料信息;将所述语料信息作文文本信息,根据各所述文本信息构建文本信息库;确定与所述文本信息库的当前应用场景相对应的词库,以基于所述相对应的词库对各所述语料信息进行分词获得分词结果;获取分词结果中各语料信息所对应的分词词语,获取所述分词词语与所述相对应的词库的匹配结果,以基于所述匹配结果对各所述分词词语分别进行词编码或字编码,生成各所述语料信息的分词编码
。3.
根据权利要求2所述的一种
POI
名称的提取方法,其特征在于,所述计算各所述分词编码的互信息与临字丰富度,以基于所述互信息与临字丰富度获取各所述语料信息中的待选
POI
名称,具体包括:获取所述分词编码的预设最大分词编码长度与预设最小分词编码长度,以基于所述预设最大分词编码长度与所述预设最小分词编码长度,确定各所述语料信息的分词编码遍历范围;在所述分词编码遍历范围内依次计算各所述分词编码的互信息与临字丰富度;对比所述分词编码的互信息与预设互信息阈值,以及所述分词编码的临字丰富度与预设临字丰富度阈值,提取所述语料信息中的待选
POI
名称
。4.
根据权利要求2所述的一种
POI
名称的提取方法,其特征在于,将所述待选
POI
名称分别输入第一判别通道与第二判别通道,获取第一判别结果与第二判别结果,具体包括:将所述待选
POI
名称输入第一判别通道,以基于所述第一判别通道将所述待选
POI
名称传输到对应的客户端,并接收所述对应的客户端对所述待选
POI
名称的第一判别结果;基于预设分类模型结构构建机器学习分类模型,以对所述机器学习分类模型进行训练获得符合要求的模型作为第二判别通道;将所述待选
POI
名称输入所述第二判别通道,以输出第二判别结果
。5.
根据权利要求4所述的一种
POI
名称的提取方法,其特征在于,将所述待选
POI
名称输入第一判别通道,以基于所述第一判别通道将所述待选
POI
名称传输到对应的客户端之前,
所述方法还包括:基于所述批量语料信息所对应的当前应用场景,确定与所述当前应用场景相对应的待选客户端;确定各所述待选客户端的当前工作状态,以确定所述待选客户端的空闲客户端;基于各空闲客户端的历史判别数量以及历史判别评价,确定各所述空闲客户端所对应的处理权重,以基于所述处理权重确定与最优空闲客户端作为与所述待选
POI
名称相对应的客户端
。6.
根据权利要求4所述的一种
POI
名称的提取方法,其特征在于,所述基于预设分类模型结构构建机器学习分类模型,以对所述机器学习分类模型进行训练获得...
【专利技术属性】
技术研发人员:孙永超,傅玉鑫,赵海兴,
申请(专利权)人:浪潮卓数大数据产业发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。