一种信息识别方法及装置制造方法及图纸

技术编号:18497111 阅读:26 留言:0更新日期:2018-07-21 20:11
本发明专利技术实施例公开了一种信息识别方法及装置,所述方法包括:通过互联网获取兴趣点的属性信息,属性信息包括兴趣点的标识信息或者地址信息;通过预置索引算法获取与属性信息相关联的坐标数据,坐标数据用于指示至少一个维度的关联信息;将属性信息与坐标数据进行比较,得到比较结果,比较结果包括属性信息与坐标数据匹配,或者属性信息与坐标数据不匹配;根据比较结果确定属性信息与坐标数据匹配时,识别属性信息的可信度大于第一预设可信度阈值;根据比较结果确定属性信息与坐标数据不匹配时,识别属性信息的可信度小于第二预设可信度阈值。采用本发明专利技术实施例,可精确识别兴趣点的属性信息的可信度,提高数字地图中标注的兴趣点的准确性。

A method and device for information recognition

An embodiment of the invention discloses an information recognition method and device. The method includes: obtaining the attribute information of the interest point through the Internet, the attribute information including the identification information or the address information of the interest point, and obtaining the sitting standard data associated with the attribute information by the preset index algorithm, and the coordinate data is used to indicate at least the data. The correlation information of a dimension is compared with the coordinate data, and the comparison results are obtained. The comparison results include the matching of the attribute information with the coordinate data, or the mismatch between the attribute information and the coordinate data; and when the attribute information is matched with the coordinate data according to the comparison results, the credibility of the identified attribute information is greater than that of the first one. A preset credibility threshold; when the attribute information is not matched with the coordinate data according to the comparison results, the credibility of the identified attribute information is less than the second preset credibility threshold. By adopting the embodiment of the invention, the credibility of the attribute information of the interest point can be accurately identified, and the accuracy of the interest points marked in the digital map can be improved.

【技术实现步骤摘要】
一种信息识别方法及装置
本专利技术涉及互联网
,尤其涉及一种信息识别方法及装置。
技术介绍
目前,数字地图可以提供导航以及搜索兴趣点等功能,兴趣点可以包括地标、景点、政府部门或者商业机构(例如加油站、百货公司、酒店或者医院)等。示例性的,服务器可以通过第三方平台获取兴趣点的地址信息,并基于该地址信息将对应的兴趣点标注在数字地图中的相应位置,以便用户可以在数字地图中搜索兴趣点及其坐标。由于兴趣点的地址信息是通过第三方平台获取到的,其地址信息的可信度无从考证,服务器直接根据从第三方平台获取到的兴趣点的地址信息,将该兴趣点标注在数字地图的相应位置,导致数字地图中显示的兴趣点的准确性较低。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种信息识别方法及装置,可精确识别兴趣点的属性信息的可信度,提高数字地图中标注的兴趣点的准确性。为了解决上述技术问题,本专利技术实施例提供了一种信息识别方法,所述方法包括:通过互联网获取兴趣点的属性信息,所述属性信息包括所述兴趣点的标识信息或者地址信息;通过预置索引算法获取与所述属性信息相关联的坐标数据,所述坐标数据用于指示至少一个维度的关联信息;将所述属性信息与所述坐标数据进行比较,得到比较结果,所述比较结果包括所述属性信息与所述坐标数据匹配,或者所述属性信息与所述坐标数据不匹配;根据所述比较结果确定所述属性信息与所述坐标数据匹配时,识别所述属性信息的可信度大于第一预设可信度阈值;根据所述比较结果确定所述属性信息与所述坐标数据不匹配时,识别所述属性信息的可信度小于第二预设可信度阈值。相应地,本专利技术实施例还提供了一种信息识别装置,所述装置包括:属性信息获取模块,用于通过互联网获取兴趣点的属性信息,所述属性信息包括所述兴趣点的标识信息或者地址信息;坐标数据获取模块,用于通过预置索引算法获取与所述属性信息相关联的坐标数据,所述坐标数据用于指示至少一个维度的关联信息;比较模块,用于将所述属性信息与所述坐标数据进行比较,得到比较结果,所述比较结果包括所述属性信息与所述坐标数据匹配,或者所述属性信息与所述坐标数据不匹配;可信度识别模块,用于根据所述比较结果确定所述属性信息与所述坐标数据匹配时,识别所述属性信息的可信度大于第一预设可信度阈值;所述可信度识别模块,还用于根据所述比较结果确定所述属性信息与所述坐标数据不匹配时,识别所述属性信息的可信度小于第二预设可信度阈值。实施本专利技术实施例,通过互联网获取兴趣点的属性信息,通过预置索引算法获取与该属性信息相关联的坐标数据,坐标数据用于指示至少一个维度的关联信息,将属性信息与坐标数据进行比较,得到比较结果,比较结果包括属性信息与坐标数据匹配,或者属性信息与坐标数据不匹配,根据比较结果确定属性信息与坐标数据匹配时,识别属性信息的可信度大于第一预设可信度阈值,根据比较结果确定属性信息与坐标数据不匹配时,识别属性信息的可信度小于第二预设可信度阈值,可精确识别兴趣点的属性信息的可信度,提高数字地图中标注的兴趣点的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;图1是本专利技术实施例中提供的一种信息识别系统的架构示意图;图2是本专利技术实施例中提供的一种信息识别方法的流程示意图;图3是本专利技术实施例中提供的一种界面示意图;图4是本专利技术实施例中提供的一种信息识别装置的结构示意图;图5是本专利技术实施例中提供的一种服务器的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种信息识别方法,通过互联网获取兴趣点的属性信息,通过预置索引算法获取与该属性信息相关联的坐标数据,坐标数据用于指示至少一个维度的关联信息,将属性信息与坐标数据进行比较,得到比较结果,比较结果包括属性信息与坐标数据匹配,或者属性信息与坐标数据不匹配,根据比较结果确定属性信息与坐标数据匹配时,识别属性信息的可信度大于第一预设可信度阈值,根据比较结果确定属性信息与坐标数据不匹配时,识别属性信息的可信度小于第二预设可信度阈值,可精确识别兴趣点的属性信息的可信度,提高数字地图中标注的兴趣点的准确性。上述信息识别方法可以运行在个人电脑、智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑、移动互联网设备(MID,MobileInternetDevices)或穿戴式智能设备等终端运行的服务器中。服务器可以是互联网中的一个独立服务设备,或者是由互联网中的多个独立服务设备共同构成的集群服务设备,服务器可以包括即时通信服务器或者SNS(SocialNetworkingServices,社会性网络服务)服务器等,例如数字地图服务器或者导航服务器等。基于上述原理,本专利技术实施例公开了图1所示的信息识别系统的架构示意图,该信息识别系统可以包括资源层、索引层、召回层以及策略层。资源层用于存储兴趣点的属性信息以及与该属性信息相关联的坐标数据。其中,属性信息可以包括兴趣点的标识信息或者地址信息,标识信息可以为兴趣点的名称,例如“腾讯大厦”等,地址信息可以为该兴趣点的位置信息,例如“北四环西路66号”等,属性信息例如图1所示的兴趣点(PointofInterest,POI)数据。具体的,资源层可以在预置数字地图中获取兴趣点的属性信息,可选的,资源层还可以通过互联网获取兴趣点的属性信息,例如通过浏览器搜索或者第三方平台等方式获取兴趣点的属性信息,具体不受本专利技术实施例的限定。索引层用于接收资源层发送的兴趣点的属性信息,并根据文本索引、点数据索引、线数据索引或者面数据索引等索引算法在预置数字地图中获取与该属性信息相关联的坐标数据,坐标数据可以包括目标属性信息、路网数据或者目标区域等。目标属性信息可以包括目标标识信息或者目标地址信息,路网数据可以包括道路信息,目标区域可以如图1所示的区划面数据、人工面数据、水域面数据、乡镇面数据或者挖掘面数据等。召回层用于获取索引层检索到的坐标数据,并将上述坐标数据存储到资源层中。本专利技术实施例中的召回层实现了对文本的全局召回,以及索引链召回集合上的在线聚类。策略层用于获取资源层中的兴趣点的属性信息,以及与该属性信息关联的坐标数据,并对该属性信息和坐标数据进行自然语言处理(NaturalLanguageProcessing,NLP)、文本解析、特征提取以及可信度识别等。其中,策略层对属性信息或者坐标数据进行NLP的具体方式可以包括分词、归一化、名称角色标注或者地址切分等。分词可以为基于专有名词、类别词或者业务名词等对属性信息或者坐标数据进行数据切分,得到若干单元属性信息。归一化可以为对属性信息或者坐标数据进行大小写转换、简繁体转换或者汉字数字转换等。策略层对属性信息或者坐标数据进行文本解析的具体方式可以包括名称解析和地址本文档来自技高网...

【技术保护点】
1.一种信息识别方法,其特征在于,所述方法包括:通过互联网获取兴趣点的属性信息,所述属性信息包括所述兴趣点的标识信息或者地址信息;通过预置索引算法获取与所述属性信息相关联的坐标数据,所述坐标数据用于指示至少一个维度的关联信息;将所述属性信息与所述坐标数据进行比较,得到比较结果,所述比较结果包括所述属性信息与所述坐标数据匹配,或者所述属性信息与所述坐标数据不匹配;根据所述比较结果确定所述属性信息与所述坐标数据匹配时,识别所述属性信息的可信度大于第一预设可信度阈值;根据所述比较结果确定所述属性信息与所述坐标数据不匹配时,识别所述属性信息的可信度小于第二预设可信度阈值。

【技术特征摘要】
1.一种信息识别方法,其特征在于,所述方法包括:通过互联网获取兴趣点的属性信息,所述属性信息包括所述兴趣点的标识信息或者地址信息;通过预置索引算法获取与所述属性信息相关联的坐标数据,所述坐标数据用于指示至少一个维度的关联信息;将所述属性信息与所述坐标数据进行比较,得到比较结果,所述比较结果包括所述属性信息与所述坐标数据匹配,或者所述属性信息与所述坐标数据不匹配;根据所述比较结果确定所述属性信息与所述坐标数据匹配时,识别所述属性信息的可信度大于第一预设可信度阈值;根据所述比较结果确定所述属性信息与所述坐标数据不匹配时,识别所述属性信息的可信度小于第二预设可信度阈值。2.如权利要求1所述的方法,其特征在于,所述通过预置索引算法获取与所述属性信息相关联的坐标数据,包括:对所述兴趣点的属性信息进行数据切分,得到若干单元属性信息;在信息数据库中查找与所述单元属性信息之间的相似度大于第一预设比例阈值的目标属性信息,所述目标属性信息包括目标标识信息或者目标地址信息。3.如权利要求2所述的方法,其特征在于,所述将所述属性信息与所述坐标数据进行比较,得到比较结果,包括:获取包含所述兴趣点的兴趣点集合,所述兴趣点集合所包含的每两个兴趣点的标识信息之间的相似度大于第二预设比例阈值;确定所述兴趣点集合所包含的所有兴趣点的数量总和小于预设数量阈值;当在所述信息数据库中查找到与所述单元属性信息之间的相似度大于所述第一预设比例阈值的目标属性信息时,确定所述属性信息与所述坐标数据不匹配。4.如权利要求1所述的方法,其特征在于,所述通过预置索引算法获取与所述属性信息相关联的坐标数据,包括:基于所述地址信息在所述预置数字地图中标注所述兴趣点;在所述预置数字地图中获取与所述兴趣点相连接的路网数据,所述路网数据包括道路信息。5.如权利要求4所述的方法,其特征在于,所述将所述属性信息与所述坐标数据进行比较,得到比较结果,包括:对所述兴趣点的地址信息进行数据切分,得到若干单元地址信息;当所述单元地址信息与所述道路信息不匹配时,确定所述属性信息与所述坐标数据不匹配。6.如权利要求1所述的方法,其特征在于,所述通过预置索引算法获取与所述属性信息相关联的坐标数据,包括:基于所述地址信息在所述预置数字地图中标注所述兴趣点;在所述预置数字地图中获取与所述兴趣点之间的距离小于第一预设距离阈值的目标区域。7.如权利要求6所述的方法,其特征在于,所述将所述属性信息与所述坐标数据进行比较,得到比较结果,包括:对所述目标区域进行分析处理,获取所述目标区域的流通量;在所述预置数字地图中获取与所述目标区域之间的距离小于第二预设距离阈值的目标兴趣点的数量总和,所述目标兴趣点的标识信息与所述兴趣点的标识信息之间的相似度大于第二预设比例阈值;当所述目标区域的流通量与所述目标兴趣点的数量总和不匹...

【专利技术属性】
技术研发人员:吴坤沈沁孟凡超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1