实体库生成方法及装置制造方法及图纸

技术编号:17486132 阅读:37 留言:0更新日期:2018-03-17 10:28
本发明专利技术提供了一种实体库生成方法及装置,上述方法包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。根据本发明专利技术提供的实体库生成方法,可获取各种类型的信息内容,而通过对用户历史搜索行为的分析可以准确确定出用户的需求实体的相关信息,以用户实际的需求实体为基础结合实体知识图谱构建符合用户个性化实体需求的实体库,在用户进行实体搜索时,可以快速并准确为用户提供符合用户搜索需求的相关信息。

Method and device for building solid base

The present invention provides a method and a device for generating entity library, the method includes: establishing entity knowledge map based on the data of vertical search sites; according to the user's search history analyzing the history of user search behavior related information relates to the needs of entities; to demand entity as a keyword, generating entity library related information combination the entity of knowledge map with the user search behavior history involved demand entities. According to the entity library generation method provided by the invention can obtain various types of information content, and through the analysis of the history of the user search behavior can accurately determine the relevant information of the user demand entity, to the user's actual demand for the construction of entity to meet the user's personalized demand entity entity library based entity knowledge map, entity search when a user can quickly and accurately provide users with relevant information according to the user's search needs.

【技术实现步骤摘要】
实体库生成方法及装置
本专利技术涉及互联网
,特别是涉及一种实体库生成方法及装置。
技术介绍
随着互联网技术的不断发展,越来越多的人通过互联网进行信息的传递与交流,因此,基于互联网所建立起的强大的信息库可供人们获取各种各样的信息。目前,相对于传统的关键词搜索,实体搜索是较为新颖的一种搜索形态。但是,同一实体可能存在歧义,而目前所涉及的只有对单一实体的单一需求识别,当用户进行信息搜索时,无法准确识别出用户的需求,进而无法为用户提供准确的搜索结果。
技术实现思路
本专利技术提供了一种实体库生成方法及装置以克服上述问题或者至少部分地解决上述问题。根据本专利技术的一个方面,提供了一种实体库生成方法,包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。可选地,所述根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息,包括:获取所述用户的搜索日志和/或点击日志,基于所述搜索日志和/或点击日志对所述用户的历史点击信息做实体链接和/或主题分类,解析出所述历史点击信息所涉及的需求实体的相关信息。可选地,所述以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库,包括:以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库。可选地,所述以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库,包括:以需求实体作为关键词,对所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型进行聚合,生成实体需求队列;根据所述用户的历史点击信息计算需求强度,将所述需求强度添加至所述实体需求队列中,生成包括所述用户需求点击模型的实体库。可选地,所述以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库之后,还包括:以预设周期更新所述用户需求点击模型。可选地,所述以预设周期更新所述用户需求点击模型,包括:通过在线学习方法建立实时点击反馈模型,以所述预设周期监测用户的实体需求变化,通过在线反馈机制调整所述用户需求点击模型中的实体需求队列的排序。根据本专利技术的另一个方面,还提供了一种实体库的生成装置,包括:建立模块,配置为基于垂直搜索类网站数据建立实体知识图谱;解析模块,配置为根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;实体库生成模块,配置为以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。可选地,所述解析模块还配置为:获取所述用户的搜索日志和/或点击日志,基于所述搜索日志和/或点击日志对所述用户的历史点击信息做实体链接和/或主题分类,解析出所述历史点击信息所涉及的需求实体的相关信息。可选地,所述实体库生成模块还配置为:以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库。可选地,所述实体库生成模块还配置为:以需求实体作为关键词,对所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型进行聚合,生成实体需求队列;根据所述用户的历史点击信息计算需求强度,将所述需求强度添加至所述实体需求队列中,生成包括所述用户需求点击模型的实体库。可选地,上述装置还包括:更新模块,配置为以预设周期更新所述用户需求点击模型。可选地,所述更新模块还配置为:通过在线学习方法建立实时点击反馈模型,以所述预设周期监测用户的实体需求变化,通过在线反馈机制调整所述用户需求点击模型中的实体需求队列的排序。根据本专利技术的再一个方面,还提供了一种计算机程序,包括计算机可读代码,当所述计算机可读代码在计算设备上运行时,导致所述计算设备执行上述任一项所述的实体库的生成方法。根据本专利技术的再一个方面,还提供了一种计算机可读介质,其中存储了所述计算机程序。本专利技术提供了一种实体库生成方法及装置,基于本专利技术提供的实体库生成方法,会先基于垂直搜索类网站数据建立实体知识图谱,并且通过用户的历史搜索行为分析出所涉及的需求实体的相关信息,进而结合需求实体的相关信息和实体知识图谱生成实体库。根据本专利技术提供的实体库生成方法,通过对垂直搜索类网站获取的信息建立实体知识图谱,可获取各种类型的信息内容,而通过对用户历史搜索行为的分析可以准确确定出用户的需求实体的相关信息,以用户实际的需求实体为基础结合实体知识图谱构建符合用户个性化实体需求的实体库,在用户进行实体搜索时,可以快速并准确为用户提供符合用户搜索需求的相关信息。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。根据下文结合附图对本专利技术具体实施例的详细描述,本领域技术人员将会更加明了本专利技术的上述以及其他目的、优点和特征。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是根据本专利技术实施例的实体库生成方法流程示意图;图2是根据本专利技术实施例的实体库生成示意图;图3是根据本专利技术实施例的实体需求队列排列示意图;图4是根据本专利技术实施例的基于实体库进行实体搜索的方法流程示意图;图5是根据本专利技术实施例的实体库生成装置的结构示意图;图6是根据本专利技术优选实施例的实体库生成装置的结构示意图;图7是根据本专利技术实施例的基于实体库进行实体搜索的装置结构示意图;图8是根据本专利技术优选实施例的基于实体库进行实体搜索的装置结构示意图;图9根据本专利技术实施例的用于执行根据本专利技术的实体库的生成方法和/或基于实体库进行实体搜索的方法的计算设备的框图示意图;图10是根据本专利技术实施例用于保持或者携带实现根据本专利技术的实体库的生成方法和/或基于实体库进行实体搜索的方法的程序代码的存储单元的示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1是根据本专利技术实施例的实体库生成方法流程示意图,如图1所示,根据本专利技术实施例的实体库生成方法包括:步骤S102,基于垂直搜索类网站数据建立实体知识图谱;步骤S104,根据用户的搜索历史记录解析出用户的历史本文档来自技高网...
实体库生成方法及装置

【技术保护点】
一种实体库生成方法,包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。

【技术特征摘要】
1.一种实体库生成方法,包括:基于垂直搜索类网站数据建立实体知识图谱;根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息;以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库。2.根据权利要求1所述的方法,其中,所述根据用户的搜索历史记录解析出所述用户的历史搜索行为所涉及的需求实体的相关信息,包括:获取所述用户的搜索日志和/或点击日志,基于所述搜索日志和/或点击日志对所述用户的历史点击信息做实体链接和/或主题分类,解析出所述历史点击信息所涉及的需求实体的相关信息。3.根据权利要求1或2所述的方法,其中,所述以需求实体作为关键词,结合所述实体知识图谱与所述用户的历史搜索行为所涉及的需求实体的相关信息生成实体库,包括:以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库。4.根据权利要求1-3任一项所述的方法,其中,所述以需求实体作为关键词,结合所述实体知识图谱以及所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型建立用户需求点击模型,生成包括所述用户需求点击模型的实体库,包括:以需求实体作为关键词,对所述用户的历史搜索行为所涉及的需求实体和/或与该需求实体对应的需求类型进行聚合,生成实体需求队列;根据所述用户的历史点击信息计算需求强度,将所述需求强度添加至所述实体...

【专利技术属性】
技术研发人员:余晓龙张华泉王浩张向征邬小鹏
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1