【技术实现步骤摘要】
一种用于人物搜索的方法、装置和计算机设备
本专利技术涉及计算机网络领域,尤其涉及一种用于人物搜索的方法、装置和计算机设备。
技术介绍
现有技术中,当用户需要搜素人物时,其多通过通用搜索引擎,输入用于搜索人物的关键词,并在搜索结果中查找其希望获得的信息。然而,由于现有技术的通用搜索引擎缺乏针对人物搜索的处理,故现有技术的搜索引擎无法提供较好的人物搜索结果,如其往往会提供大量的、用户可能不需要的或不准确的信息。例如,搜索引擎往往会提供大量的、并非针对人物的搜索结果,使得用户需要在海量结果中查询其需要的人物信息;又例如,搜索引擎可能提供错误的人物信息,因为互联网中往往由于诸如恶作剧、恶意标注、自我标榜等因素而使得人物介绍与人物不符,如一个普通人可以标榜其为全国著名的心脏病专家并被搜索引擎提供给用户;再例如,一些专业人物可能仅在小众网站或社区中活动,使得其难以被搜索引擎挖掘出并提供给用户等。
技术实现思路
本专利技术的目的是提供一种用于搜索人物的方法、装置和计算机设备。根据本专利技术的一个方面,提供一种用于搜索人物的方法,其中,该方法包括以下步骤:a获取来自用户的搜索序列;b由所述搜索序列中获取至少一个搜索分词;c基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;d根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序;e将排序后的候选人物提供给所述用户。根据本专利技术的另一个方面,还提供了一种用于搜索人物的搜索装 ...
【技术保护点】
一种用于搜索人物的方法,其中,该方法包括以下步骤:a获取来自用户的搜索序列;b由所述搜索序列中获取至少一个搜索分词;c基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;d根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序;e将排序后的候选人物提供给所述用户。
【技术特征摘要】
1.一种用于搜索人物的方法,其中,该方法包括以下步骤:a获取来自用户的搜索序列;b由所述搜索序列中获取至少一个搜索分词;c基于所述至少一个搜索分词获得至少一个候选人物,其中,所述至少一个搜索分词的全部或部分中的每个搜索分词均能与一个候选人物的人物标签中的一个或多个匹配;d根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序,其中,结合候选人物的社区网络活动或者个人信息来确定该候选人物的人物标签的权重信息;e将排序后的候选人物提供给所述用户;其中,该方法还包括:x根据与一个人物相关联的其他人物的人物标签是否能够表征所述其他人物的特征,和/或,所述其他人物发布的内容,更新所述人物的人物标签,其中,所述其他人物的一个人物标签在所有与该人物相关联的其他人物的人物标签中出现的次数越高,且在大量人物的人物标签中出现的次数越低,则所述其他人物的该人物标签的特征表征能力越强,越适用于更新操作。2.根据权利要求1所述的方法,其中,所述步骤c包括以下步骤:-获取所述至少一个搜索分词中的每个搜索分词所匹配的人物列表;-确定在所有匹配获得的人物列表中均存在的人物,作为所述至少一个候选人物。3.根据权利要求1或2所述的方法,其中,所述步骤d包括以下步骤:-对所述至少一个候选人物中的每一个候选人物,根据该候选人物的、与所述至少一个搜索分词匹配的人物标签的权重信息,确定该候选人物与所述搜索序列相对应的权重信息;-根据各个候选人物的权重信息,对所述至少一个候选人物中的全部或部分候选人物进行排序。4.根据权利要求1或2所述的方法,其中,所述步骤d包括以下步骤:-根据各个候选人物的、与所述搜索分词匹配的人物标签的权重信息,并结合各个候选人物对应的认证信息,对所述至少一个候选人物中的全部或部分候选人物进行排序。5.根据权利要求1或2所述的方法,其中,所述步骤b包括以下步骤:-对所述搜索序列进行分词,获得分词列表;-从所述分词列表中选择重要分词,作为所述至少一个搜索分词。6.根据权利要求1或2所述的方法,其中,所述步骤b包括以下步骤:-对所述搜索序列进行分词,获得所述至少一个搜索分词;其中,所述分词的操作考虑以下至少一项因素:-所述搜索序列的不同分词结果的语义差别;-所述搜索序列与预定分词词库的匹配结果。7.根据权利要求1所述的方法,其中,所述步骤x包括以下步骤:-根据与所述人物相关联的其他人物的地址特征与网络社交关系特征,将与所述人物相关联的其他人物划分为多个分组;-根据所述多个分组中全部或部分分组包含的所述其他人物的人物标签是否能够表征所述其他人物的特征,和/或,所述其他人物发布的内容,获得一个或多个人物标签;-根据所述一个或多个人物标签,更新所述人物的人物标签。8.根据权利要求1、2或7所述的方法,其中,该方法还包括以下步骤:-根据所述人物发布的内容,确定至少一个人物标签;-根据所述至少一个人物标签,更新所述人物的人物标签。9.根据权利要求1、2或7所述的方法,其中,该方法还包括以下步骤:-根据以下至少一项因素,确定人物的人物标签的权重信息;-具有该人物标签的其他人物对该人物的关注程度;-该人物对具有该人物标签的其他人物的关注程度;-该人物发布的、具有该人物标签的特征的内容的数量;-该人物发布的、具有该人物标签的特征的内容被其他人物关注的程度;-该人物对其他人物发布的、具有该人物标签的特征的内容的关注程度;-该人物是否具有与该人物标签对应的认证信息。10.一种用于搜索人物的搜索装置,其中,该搜索装置包括:第一获取装置,用于获取来自用户的搜索序列;第二获取装置,用于由所述搜索序列中获取至少一个搜索分词;第一确定装置,用于基于所述至少一个搜索分词获得至少一个候选人物,其中,所...
【专利技术属性】
技术研发人员:张超,赵世奇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。