【技术实现步骤摘要】
本专利技术涉及计算机处理的
,特别是涉及一种兴趣点名称的识别方法和一 种兴趣点名称的识别装置。
技术介绍
兴趣点(Point of Interest,Ρ0Ι),又可以翻译成"信息点",其包含多方面的信 息,如名称、类别、经度炜度等等。 在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站 等。 传统的地理信息采集方法需要地图测绘人员采用精密的测绘仪器去获取一个兴 趣点的经炜度,然后再标记下来。 正因为POI数据的采集是一个非常费时费事的工作,对一个地理信息系统来说, POI的数量在一定程度代表着整个系统的价值。 为了丰富地理信息系统的POI数据的数量,目前从网页中挖掘POI数据,大多是根 据网页的结构配置合适的模板,通过模板来提取。 但是,用户并不一定会按照网页的规定去发布信息,使得这些包含POI的网站中 充斥着大量的脏数据,是错误的POI数据。 例如,某个网站约定网页的一个区域是发布公司名称,但是,有的用户可能发布诸 如"世界五百强企业"等数据,并非是一个真正的POI名称。 若后续应用这些错误的POI数据进行导航等操作, ...
【技术保护点】
一种兴趣点名称的识别方法,包括:在网页中提取兴趣点数据;所述兴趣点数据包括兴趣点名称;将标识同一对象的兴趣点名称设置为兴趣点名称集合;从所述兴趣点名称集合中识别正确的第二目标兴趣点名称。
【技术特征摘要】
【专利技术属性】
技术研发人员:王智广,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。