一种专有地名的识别方法和装置制造方法及图纸

技术编号:9906941 阅读:95 留言:0更新日期:2014-04-11 05:55
本发明专利技术提供了一种专有地名的识别方法和装置,所述方法包括:获取用户输入的搜索词和用户的特征信息;利用所述搜索词进行查询,并根据查询结果和所述特征信息确定所述搜索词的可信度;判断是否所述可信度大于预设阈值且所述搜索词符合预定义的名称规则,如果是,则将所述搜索词识别为专有地名。相较于现有技术,本发明专利技术利用用户的地理位置和操作行为特征,进行有效的LBS领域的专有地名识别,可以提升地图检索服务的专有地名识别的召回率和准确率,从而提高地图检索的召回率和准确率,提升地图检索的处理速度。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种专有地名的识别方法和装置,所述方法包括:获取用户输入的搜索词和用户的特征信息;利用所述搜索词进行查询,并根据查询结果和所述特征信息确定所述搜索词的可信度;判断是否所述可信度大于预设阈值且所述搜索词符合预定义的名称规则,如果是,则将所述搜索词识别为专有地名。相较于现有技术,本专利技术利用用户的地理位置和操作行为特征,进行有效的LBS领域的专有地名识别,可以提升地图检索服务的专有地名识别的召回率和准确率,从而提高地图检索的召回率和准确率,提升地图检索的处理速度。【专利说明】一种专有地名的识别方法和装置【
】本专利技术涉及地图信息处理
,特别涉及一种专有地名的识别方法和装置。【
技术介绍
】随着社会信息化的发展,以地名信息为基础的基于位置服务(LocationBasedService, LBS)的需求日益增长,人们越来越依赖于通过LBS服务进行地理信息检索,来快速准确的找到所需要的信息。地理信息检索就是在传统信息检索的基础上,充分利用与地理相关的信息,结合地理信息的特点和处理方式,帮助用户更加有效的完成信息检索。地理信息检索技术主要是通过地名检索用以返回地名或实体对象的地理空间位置等信息,例如,检索某个兴趣点POI的地理位置或进行线路规划等,以及通过类型或关系检索用以返回满足条件的兴趣点位置,例如检索某个地点附近的餐馆、娱乐场所等。地名是表达某一特定空间位置上自然或人文地理实体的专有名称,由于人们在日常交流中大多依赖地 名来表达和接收地理位置,因而在类型或关系检索时往往需要地名来参与表达查询内容。因此,地名检索成为地理信息检索技术中最为广泛的应用。然而,现有地名检索技术有时并不能正确理解地名所蕴含的地理空间语义,会出现查不准的现象。为了提高利用地名检索的准确度,利用专有地名可以直接匹配出准确的地理位置信息,从而提升地名检索的准确度,快速地返回检索结果。现有的专有地名识别的方法主要是通过在整个互联网的大搜索集合中去统计搜索词中包含各个词项(term)的共现频率,来判断是否是专有地名的。然而,采用这种方法由于数据集与领域经验的差异,在LBS领域中大部分搜索词在互联网数据中对应的数据较少,并不具备统计意义,专名识别召回不够高;而且,还容易受到其他领域相关数据的干扰,专有地名识别的准确率也不高。【
技术实现思路
】有鉴于此,本专利技术提供了一种专有地名的识别方法和装置,可以提升地图检索服务的专有地名识别的召回率和准确率,从而提高地图检索的召回率和准确率,提升地图检索的处理速度。具体技术方案如下:一种专有地名的识别方法,该方法包括以下步骤:获取用户输入的搜索词和用户的特征信息;利用所述搜索词进行查询,并根据查询结果和所述特征信息确定所述搜索词的可信度;判断是否所述可信度大于预设阈值且所述搜索词符合预定义的名称规则,如果是,则将所述搜索词识别为专有地名。根据本专利技术一优选实施例,所述特征信息包括:在用户输入搜索词时用户所选择的搜索模式;在用户输入搜索词之前或之后用户所选择的图区操作模式;和/或用户所在的地理位置。根据本专利技术一优选实施例,所述利用搜索词进行查询,根据查询结果和所述特征信息确定所述搜索词的可信度,具体包括:判断是否在所述搜索模式下能查询得到与所述搜索词相匹配的结果且所述搜索模式为预定义的搜索模式,如果是,则增大所述搜索词的可信度。根据本专利技术一优选实施例,所述利用搜索词进行查询,根据查询结果和所述特征信息确定所述搜索词的可信度,具体包括:判断用户是否有所述图区操作模式的动作,且在用户完成所述图区操作模式的动作之后所在的图区范围内能查询得到与所述搜索词相匹配的结果,如果是,则增大所述搜索词的可信度。根据本专利技术一优选实施例,所述利用搜索词进行查询,根据查询结果和所述特征信息确定所述搜索词的可信度,具体包括:判断利用所述搜索词,在与所述位置信息的距离在预设距离阈值之内是否能查询到的相匹配的结果,如果是,则增大所述搜索词的可信度。根据本专利技术一优选实施例,在将所述搜索词识别为专有地名之后,还包括:将识别为专有地名的搜索词形成专有地名集合,并根据用户后续的查询结果对所述专有地名集合进行动态调整。根据本专利技术一优选实施例,所述根据用户后续的查询结果对所述专有地名集合进行动态调整,具体为:当用户利用所述专有地名集合中的搜索词进行查询但得不到相匹配的结果时,降低所述搜索词的可信度;当所述可信度低于预设阈值时,将所述搜索词识别为非专有地名,并从所述专有地名集合中删除。一种专有地名的识别装置,该装置包括:获取模块,用于获取用户输入的搜索词和用户的特征信息;查询处理模块,用于利用所述搜索词进行查询,并根据查询结果和所述特征信息确定所述搜索词的可信度;综合判断模块,用于判断是否所述可信度大于预设阈值且所述搜索词是否符合预定义的名称规则,如果是,则将所述搜索词识别为专有地名。根据本专利技术一优选实施例,所述获取模块包括:第二获取子模块,用于在用户输入搜索词时获取用户所选择的搜索模式;第三获取子模块,用于在用户输入搜索词之前或之后获取用户所选择的图区操作模式;或者第四获取子模块,用于获取用户所在的地理位置。根据本专利技术一优选实施例,所述查询处理模块包括:第一处理子模块,用于判断所述第二获取子模块获取的搜索模式是否为预定义的搜索模式且利用所述搜索词在所述搜索模式下能查询得到相匹配的结果,如果是,则增大所述搜索词的可信度。根据本专利技术一优选实施例,所述查询处理模块包括:第二处理子模块,用于判断所述第三获取子模块是否有获取到所述图区操作模式的动作,且利用所述搜索词在用户完成所述图区操作模式的动作之后所在的图区范围内能查询得到相匹配的结果,如果是,则增大所述搜索词的可信度。根据本专利技术一优选实施例,所述查询处理模块包括:第三处理子模块,用于判断利用所述搜索词,在与所述位置信息的距离在预设距离阈值之内是否能查询到的相匹配的结果,如果是,则增大所述搜索词的可信度。根据本专利技术一优选实施例,所述装置还包括:调整模块,用于针对所述综合判断模块识别为专有地名的搜索词所形成的专有地名集合,根据用户后续的查询结果进行动态调整。根据本专利技术一优选实施例,所述调整模块具体用于当用户利用所述专有地名集合中的搜索词进行查询但得不到相匹配的结果时,将所述搜索词识别为非专有地名,并从所述专有地名集合中删除。由以上技术方案可以看出,本专利技术提供的专有地名的识别方法和装置,利用用户的地理位置和操作行为特征,进行有效的LBS领域的专有地名识别,可以提升地图检索服务的专有地名识别的召回率和准确率。本专利技术利用用户的地理位置、所选的搜索模式以及进行的图区操作模式,决定了识别结果的偏向,并不断根据检索结果对专有地名进行动态调整,保证了专名识别的准 确率,从而提高地图检索的召回率和准确率,提升地图检索的处理速度。【【专利附图】【附图说明】】图1为本专利技术实施例一提供的专有地名的识别方法流程图;图2为本专利技术实施例二提供的专有地名的识别方法流程图;图3为本专利技术实施例三提供的专有地名的识别装置示意图;图4为本专利技术实施例四提供的专有地名的识别装置示意图。【【具体实施方式】】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。实施例一本文档来自技高网
...
一种专有地名的识别方法和装置

【技术保护点】
一种专有地名的识别方法,其特征在于,所述方法包括:获取用户输入的搜索词和用户的特征信息;利用所述搜索词进行查询,并根据查询结果和所述特征信息确定所述搜索词的可信度;判断是否所述可信度大于预设阈值且所述搜索词符合预定义的名称规则,如果是,则将所述搜索词识别为专有地名。

【技术特征摘要】

【专利技术属性】
技术研发人员:李扬
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1