一种用于人物搜索的方法、装置和计算机设备制造方法及图纸

技术编号:9967534 阅读:118 留言:0更新日期:2014-04-25 08:06
本发明专利技术提供一种用于人物搜索的方法,其中,该方法包括以下步骤:获取来自用户的搜索序列;由所述搜索序列中获取至少一个搜索分词;基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序;将排序后的候选人物提供给所述用户。

【技术实现步骤摘要】
一种用于人物搜索的方法、装置和计算机设备
本专利技术涉及计算机网络领域,尤其涉及一种用于人物搜索的方法、装置和计算机设备。
技术介绍
现有技术中,当用户需要搜素人物时,其多通过通用搜索引擎,输入用于搜索人物的关键词,并在搜索结果中查找其希望获得的信息。然而,由于现有技术的通用搜索引擎缺乏针对人物搜索的处理,故现有技术的搜索引擎无法提供较好的人物搜索结果,如其往往会提供大量的、用户可能不需要的或不准确的信息。例如,搜索引擎往往会提供大量的、并非针对人物的搜索结果,使得用户需要在海量结果中查询其需要的人物信息;又例如,搜索引擎可能提供错误的人物信息,因为互联网中往往由于诸如恶作剧、恶意标注、自我标榜等因素而使得人物介绍与人物不符,如一个普通人可以标榜其为全国著名的心脏病专家并被搜索引擎提供给用户;再例如,一些专业人物可能仅在小众网站或社区中活动,使得其难以被搜索引擎挖掘出并提供给用户等。
技术实现思路
本专利技术的目的是提供一种用于搜索人物的方法、装置和计算机设备。根据本专利技术的一个方面,提供一种用于搜索人物的方法,其中,该方法包括以下步骤:a获取来自用户的搜索序列;b由所述搜索序列中获取至少一个搜索分词;c基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;d根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序;e将排序后的候选人物提供给所述用户。根据本专利技术的另一个方面,还提供了一种用于搜索人物的搜索装置,其中,该搜索装置包括:第一获取装置,用于获取来自用户的搜索序列;第二获取装置,用于由所述搜索序列中获取至少一个搜索分词;第一确定装置,用于基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;排序装置,用于根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序;提供装置,用于将排序后的候选人物提供给所述用户。与现有技术相比,本专利技术具有以下优点:1)能够针对人物进行检索,并能够基于与搜索序列匹配的人物标签的权重,来对候选人物进行排序,从而使得人物检索结果的可靠度较高;2)可以结合人物的社区网络活动或者个人信息来确定其人物标签的权重信息,从而进一步确保了基于人物标签的搜索和排序的准确性;3)能够在通用搜索引擎中实现人物搜索,从而能够实现跨网络社区的人物搜索功能;4)通过与人物相关联的其他人物以及人物自身所发布的内容来为该人物更新标签,使得人物的标签能更有效的、更完整的反应人物的特征,且通过人物标签的添加、删除以及更改等操作使得人物标签能够更准确的反应人物当前所具有的特征,减少了在人物搜索中出现人物遗漏或者人物标签不准确的情况,从而使得人物搜索的搜索结果更加全面,也更加符合用户的搜索条件。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术一个实施例的用于搜索人物的方法流程示意图;图2为本专利技术另一个实施例的用于搜索人物的方法流程示意图;图3为本专利技术另一个实施例的用于搜索人物的方法流程示意图;图4为本专利技术一个实施例的用于搜索人物的搜索装置的结构示意图;图5为本专利技术另一个实施例的用于搜索人物的搜索装置的结构示意图;图6为本专利技术另一个实施例的用于搜索人物的搜索装置的结构示意图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本专利技术作进一步详细描述。图1为本专利技术一个实施例的用于搜索人物的方法流程示意图。其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括网络设备和用户设备;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述用户设备可包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等;所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。需要说明的是,所述网络设备、用户设备和网络仅为举例,其他现有的或今后可能出现的计算设备或网络如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。根据本实施例的方法包括步骤S1、步骤S2、步骤S3、步骤S4和步骤S5。优选地,根据本实施例的方法可在通用搜索引擎中实现,该通用搜索引擎能够获得跨网络社区的人物信息。在步骤S1中,计算机设备获取来自用户的搜索序列。其中,计算机设备获取来自用户的搜索序列的方式包括但不限于:1)计算机设备为直接与用户交互的用户设备,则计算机设备直接获取用户输入的搜索序列。例如,计算机设备为PC机,PC机直接获得用户直接在其浏览器搜索输入框中输入的搜索序列。2)计算机设备通过其他计算机设备获取用户输入的搜索序列。例如,计算机设备为网络设备,用户在用户设备的浏览器搜索输入框中输入搜索序列,用户设备将该搜索序列通过网络提供给网络设备,网络设备通过网络获取该搜索序列。需要说明的是,上述举例仅为更好地说明本专利技术的技术方案,而非对本专利技术的限制,本领域技术人员应该理解,任何获取来自用户的搜索序列的实现方式,均应包含在本专利技术的范围内。在步骤S2中,计算机设备由所述搜索序列中获取至少一个搜索分词。具体地,计算机设备可采用多种方式,从搜索序列中获取至少一个搜索分词。如作为步骤S2的一种优选方式,步骤S2进一步包括步骤S201和步骤S202。在步骤S201中,计算机设备对所述搜索序列进行分词,获得分词列表。例如,计算机设备在步骤S1中获得来自用户的搜索序列“经济类的律师”,计算机设备根据语义分析以及预定分词词库,对该搜索序列进行分词,获取分词列表包含“经济类”、“的”以及“律师”的分词列表。在步骤S202中,计算机设备从所述分词列表中选择重要分词,作为所述至少一个搜索分词。其中,计算机设备可通过多种方式来确定分词列表中的分词是否为重要分词;例如计算机设备可通过将分词列表中的分词与预定分词词库中的分词匹配,和/或,基于对搜索序列的语义分析、对分词列表中的分词本身的语义分析以及基于分词列表中的分词在搜索序列中的语法位置分析等,来确定分词列表中的分词是否为重要分词。例如,在步骤S201中,计算机设备通过对搜索序列“经济类的律师”进行分词,获得分词列表,其中包含的分词为“经济类”、“的”以及“律师”;在步骤S202中,计算机设备将分词列表中的分词与预定分词词库中的分词进行匹配,并根据匹配结果选择重要分词“经济类”和“律师”,作为搜索序列“经济类的律师”所对应的两个搜索分词。需要说明的是,上述举例仅为更好地说明本专利技术的技术方案,而非对本专利技术的限制,本领域技术人员应该理解,任何对所述搜索序列进行分词,获得分词列表,并从所述分词列表中选择重要分词,作为所述至少一个搜索分词的实现方式,均应包含在本专利技术的范围内。又如作为步骤S2的另一种优选方式,步骤S2包括步本文档来自技高网...
一种用于人物搜索的方法、装置和计算机设备

【技术保护点】
一种用于搜索人物的方法,其中,该方法包括以下步骤:a获取来自用户的搜索序列;b由所述搜索序列中获取至少一个搜索分词;c基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;d根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序;e将排序后的候选人物提供给所述用户。

【技术特征摘要】
1.一种用于搜索人物的方法,其中,该方法包括以下步骤:a获取来自用户的搜索序列;b由所述搜索序列中获取至少一个搜索分词;c基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;d根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序,其中,结合候选人物的社区网络活动或者个人信息来确定该候选人物的人物标签的权重信息;e将排序后的候选人物提供给所述用户;其中,该方法还包括:x根据与一个人物相关联的其他人物的人物标签是否能够表征所述其他人物的特征,和/或,所述其他人物发布的内容,更新所述人物的人物标签,其中,所述其他人物的一个人物标签在所有与该人物相关联的其他人物的人物标签中出现的次数越高,且在大量人物的人物标签中出现的次数越低,则所述其他人物的该人物标签的特征表征能力越强,越适用于更新操作。2.根据权利要求1所述的方法,其中,所述步骤c包括以下步骤:-获取所述至少一个搜索分词中的每个搜索分词所匹配的人物列表;-确定在所有匹配获得的人物列表中均存在的人物,作为所述至少一个候选人物。3.根据权利要求1或2所述的方法,其中,所述步骤d包括以下步骤:-对所述至少一个候选人物中的每一个候选人物,根据该候选人物的、与所述至少一个搜索分词匹配的人物标签的权重信息,确定该候选人物与所述搜索序列相对应的权重信息;-根据各个候选人物的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序。4.根据权利要求1或2所述的方法,其中,所述步骤d包括以下步骤:-根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,并结合各个候选人物对应的认证信息,对所述至少一个候选人物中的全部或部分候选人物进行排序。5.根据权利要求1或2所述的方法,其中,所述步骤b包括以下步骤:-对所述搜索序列进行分词,获得分词列表;-从所述分词列表中选择重要分词,作为所述至少一个搜索分词。6.根据权利要求1或2所述的方法,其中,所述步骤b包括以下步骤:-对所述搜索序列进行分词,获得所述至少一个搜索分词;其中,所述分词的操作考虑以下至少一项因素:-所述搜索序列的不同分词结果的语义差别;-所述搜索序列与预定分词词库的匹配结果。7.根据权利要求1所述的方法,其中,所述步骤x包括以下步骤:-根据与所述人物相关联的其他人物的地址特征与网络社交关系特征,将与所述人物相关联的其他人物划分为多个分组;-根据所述多个分组中全部或部分分组包含的所述其他人物的人物标签是否能够表征所述其他人物的特征,和/或,所述其他人物发布的内容,获得一个或多个人物标签;-根据所述一个或多个人物标签,更新所述人物的人物标签。8.根据权利要求1、2或7所述的方法,其中,该方法还包括以下步骤:-根据所述人物发布的内容,确定至少一个人物标签;-根据所述至少一个人物标签,更新所述人物的人物标签。9.根据权利要求1、2或7所述的方法,其中,该方法还包括以下步骤:-根据以下至少一项因素,确定人物的人物标签的权重信息;-具有该人物标签的其他人物对该人物的关注程度;-该人物对具有该人物标签的其他人物的关注程度;-该人物发布的、具有该人物标签的特征的内容的数量;-该人物发布的、具有该人物标签的特征的内容被其他人物关注的程度;-该人物对其他人物发布的、具有该人物标签的特征的内容的关注程度;-该人物是否具有与该人物标签对应的认证信息。10.一种用于搜索人物的搜索装置,其中,该搜索装置包括:第一获取装置,用于获取来自用户的搜索序列;第二获取装置,用于由所述搜索序列中获取至少一个搜索分词;第一确定装置,用于基于所述至少一个搜索分词获得至少一个候选人物,其中,所...

【专利技术属性】
技术研发人员:张超赵世奇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1