【技术实现步骤摘要】
基于SPO数据的搜索方法、装置、设备和存储介质
本专利技术涉及计算机
,尤其涉及一种基于SPO数据的搜索方法、装置、设备和存储介质。
技术介绍
随着信息技术的飞速发展,当今社会进入了信息爆炸时代,人们越来越多地借助网络来寻找自己需要的信息,因此,检索成为人们工作、生活不可或缺的一部分。人们通常使用搜索引擎来进行检索,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将与用户检索相关的信息展示给用户的系统。用户在使用搜索引擎时,通过搜索查询条件(例如刘德华)识别到用户需求的实体,然后展现实体的基本信息以及一些跳转链接,如果用户想看更多的该实体的属性信息,则需要点击链接跳转,然后去跳转之后的页面去查找,操作繁琐,用户体验较差。
技术实现思路
本专利技术提供一种基于SPO数据的搜索方法、装置、设备和存储介质,以解决现有的搜索过程中操作繁琐,用户体验较差的问题。第一方面,本专利技术提供一种基于SPO数据的搜索方法,包括:接收用户的搜索请求;所述搜索请求包括实体名称;根据预先存储的知识图谱的SPO数据,获取所述实体名称对应的属性名和属性值;所述SPO数据包括主语S、谓语P、宾语O三元组信息;所述S元组用于存储实体名称;所述P元组用于存储与所述实体名称对应的属性名;所述O元组用于存储与所述实体名称对应的属性值;向所述用户显示所述实体名称对应的属性名和属性值第二方面,本专利技术提供一种基于SPO数据的搜索装置,包括:接收模块,用于接收用户的搜索请求;所述搜索请求包括实体名称;处理模块,用于根据预先存储的知 ...
【技术保护点】
1.一种基于SPO数据的搜索方法,其特征在于,包括:接收用户的搜索请求;所述搜索请求包括实体名称;根据预先存储的知识图谱的SPO数据,获取所述实体名称对应的属性名和属性值;所述SPO数据包括主语S、谓语P、宾语O三元组信息;S元组用于存储实体名称;P元组用于存储与所述实体名称对应的属性名;O元组用于存储与所述实体名称对应的属性值;向所述用户显示所述实体名称对应的属性名和属性值。
【技术特征摘要】
1.一种基于SPO数据的搜索方法,其特征在于,包括:接收用户的搜索请求;所述搜索请求包括实体名称;根据预先存储的知识图谱的SPO数据,获取所述实体名称对应的属性名和属性值;所述SPO数据包括主语S、谓语P、宾语O三元组信息;S元组用于存储实体名称;P元组用于存储与所述实体名称对应的属性名;O元组用于存储与所述实体名称对应的属性值;向所述用户显示所述实体名称对应的属性名和属性值。2.根据权利要求1所述的方法,其特征在于,所述获取所述实体名称对应的属性名和属性值之前,还包括:将获取到的源数据进行转化处理,得到SPO数据;将所述SPO数据作为所述知识图谱的数据项收录在SPO库中;所述获取所述实体名称对应的属性名和属性值,包括:根据所述SPO库中存储的SPO数据,获取所述实体名称对应的属性名和属性值。3.根据权利要求2所述的方法,其特征在于,所述源数据包括结构化数据;所述结构化数据包括:实体名称以及与所述实体名称对应的属性名和属性值;所述将获取到的源数据进行转化处理,包括:将所述结构化数据中的实体名称存储在所述SPO数据的S元组中;建立所述结构化数据中的属性名与所述知识图谱的模式schema上定义的属性名PID的对应关系,并将所述对应关系存储在所述SPO数据的P元组中;将所述结构化数据中的属性值根据所述schema的约束条件进行处理,得到处理后的属性值,并将所述属性值存储在所述SPO数据的O元组中。4.根据权利要求2或3所述的方法,其特征在于,将所述SPO数据作为所述知识图谱的数据项收录在SPO库中之前,还包括:对所述SPO数据分配来源标识ID;根据所述SPO数据的S、P、O三元组信息、所述来源标识ID和来源方式计算所述SPO数据的第一标识ID。5.根据权利要求4所述的方法,其特征在于,还包括:对所述SPO数据分配第二标识ID;建立所述第一标识ID和所述第二标识ID的对应关系。6.根据权利要求2或3所述的方法,其特征在于,将所述SPO数据作为所述知识图谱的数据项收录在SPO库中,包括:将所述SPO数据流式收录到所述SPO库中;和/或,将所述SPO数据批量收录到所述SPO库中。7.根据权利要求5所述的方法,其特征在于,所述对所述SPO数据分配第二标识ID,包括:利用redis的原子setnx操作对所述SPO数据分配所述第二标识ID。8.根据权利要求6所述的方法,其特征在于,将所述SPO数据作为所述知识图谱的数据项收录在SPO库中,包括:根据所述SPO数据的版本号,将所述SPO数据收录在所述SPO库中。9.根据权利要求2或3所述的方法,其特征在于,将所述SPO数据作为所述知识图谱的数据项收录在SPO库中之前,还包括:建立所述SPO数据的实体名称对应的属性值与其他实体名称的关联关系。10.根据权利要求2或3所述的方法,其特征在于,将所述SPO数据作为所述知识图谱的数据项收录在SPO库中之前,还包括:计算所述SPO数据的置信度,所述置信度用于衡量所述SPO数据的准确性。11.根...
【专利技术属性】
技术研发人员:许超,陆超,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。