The present invention provides a method and a device for generating entity library, the method includes: establishing entity knowledge map based on the data of vertical search sites; according to the user's search history analyzing the history of user search behavior related information relates to the needs of entities; to demand entity as a keyword, generating entity library related information combination the entity of knowledge map with the user search behavior history involved demand entities. According to the entity library generation method provided by the invention can obtain various types of information content, and through the analysis of the history of the user search behavior can accurately determine the relevant information of the user demand entity, to the user's actual demand for the construction of entity to meet the user's personalized demand entity entity library based entity knowledge map, entity search when a user can quickly and accurately provide users with relevant information according to the user's search needs.
【技术实现步骤摘要】
实体库生成方法及装置
本专利技术涉及互联网
,特别是涉及一种实体库生成方法及装置。
技术介绍
随着互联网技术的不断发展,越来越多的人通过互联网进行信息的传递与交流,因此,基于互联网所建立起的强大的信息库可供人们获取各种各样的信息。目前,相对于传统的关键词搜索,实体搜索是较为新颖的一种搜索形态。但是,同一实体可能存在歧义,而目前所涉及的只有对单一实体的单一需求识别,当用户进行信息搜索时,无法准确识别出用户的需求,进而无法为用户提供准确的搜索结果。
技术实现思路
本专利技术提供了一种实体库生成方法及装置以克服上述问题或者至少部分地解决上述问题。根据本专利技术的一个方面,提供了一种实体库生成方法,包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。可选地,所述根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息,包括:获取所述用户的搜索日志和/或点击日志,基于所述搜索日志和/或点击日志对所述用户的历史点击信息做实体链接和/或主题分类,解析出所述历史点击信息所涉及的需求实体的相关信息。可选地,所述以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库,包括:以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模 ...
【技术保护点】
一种实体库生成方法,包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。
【技术特征摘要】
1.一种实体库生成方法,包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。2.根据权利要求1所述的方法,其中,所述根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息,包括:获取所述用户的搜索日志和/或点击日志,基于所述搜索日志和/或点击日志对所述用户的历史点击信息做实体链接和/或主题分类,解析出所述历史点击信息所涉及的需求实体的相关信息。3.根据权利要求1或2所述的方法,其中,所述以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库,包括:以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库。4.根据权利要求1-3任一项所述的方法,其中,所述以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库,包括:以需求实体作为关键词,对所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型进行聚合,生成实体需求队列;根据所述用户的历史点击信息计算需求强度,将所述需求强度添加至所述实体...
【专利技术属性】
技术研发人员:余晓龙,张华泉,王浩,张向征,邬小鹏,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。