一种基于文本图谱的智能搜索引擎的检索方法技术

技术编号:29526698 阅读:41 留言:0更新日期:2021-08-03 15:13
本发明专利技术提供一种基于文本图谱的智能搜索引擎的检索方法,涉及计算机技术领域,包括获取数据信息存储至分布式系统集群中,并构建文本图谱;根据用户输入的搜索语句,建立节点查询语句;根据节点查询语句在文本图谱中匹配三元组;若匹配成功,则将匹配到的三元组中的实体作为搜索结果返回客户;若匹配不成功,则对搜索语句进行分词,获取检索词;利用余弦相似度公式计算分布式系统集群中与检索词相关性最高的实体并返回用户。本发明专利技术通过构建文本图谱,进一步根据搜索目标建立实体与关系的节点查询语句,进而根据节点查询语句在文本图谱中进行检索,能够准确快速的得到搜索目标。

【技术实现步骤摘要】
一种基于文本图谱的智能搜索引擎的检索方法
本专利技术涉及计算机
,尤其是涉及一种基于文本图谱的智能搜索引擎的检索方法。
技术介绍
随着互联网网站页面的激增和用户队伍的不断壮大,搜索引擎越来越成为人们上网浏览时的重要工具。目前,在进行目标搜索时,用户可以在百度、谷歌等搜索引擎或门户网站输入查询内容,搜索引擎或门户网站根据输入内容提取关键词进行相关信息的检索,将搜索结果展示在网页中,用户在网页中逐条筛选所需的信息;这种根据关键词进行目标搜索的方法,获取的结果往往是零散化和碎片化的,精确度不高,缺少联系,还可能具有歧义性,最后需要在搜索结果中人为地甄别有用信息;并且在通过门户网站进行搜索时,由于门户网站(如论坛)中的信息比较杂乱,仅靠关键词得到的搜索结果不能体现搜索目标,搜索效率低。
技术实现思路
针对上述问题,本专利技术提供了一种基于文本图谱的智能搜索引擎的检索方法,通过构建文本图谱,进一步根据搜索目标建立实体与关系的节点查询语句,进而根据节点查询语句在文本图谱中进行检索,准确快速的得到搜索目标。为本文档来自技高网...

【技术保护点】
1.一种基于文本图谱的智能搜索引擎的检索方法,其特征在于,包括:/n获取数据信息存储至分布式系统集群中,并构建文本图谱;/n根据用户输入的搜索语句,建立节点查询语句;/n根据所述节点查询语句在所述文本图谱中匹配三元组;/n若匹配成功,则将匹配到的所述三元组中的实体作为搜索结果返回客户;/n若匹配不成功,则对所述搜索语句进行分词,获取检索词;/n利用余弦相似度公式计算所述分布式系统集群中与所述检索词相关性最高的实体并返回用户。/n

【技术特征摘要】
1.一种基于文本图谱的智能搜索引擎的检索方法,其特征在于,包括:
获取数据信息存储至分布式系统集群中,并构建文本图谱;
根据用户输入的搜索语句,建立节点查询语句;
根据所述节点查询语句在所述文本图谱中匹配三元组;
若匹配成功,则将匹配到的所述三元组中的实体作为搜索结果返回客户;
若匹配不成功,则对所述搜索语句进行分词,获取检索词;
利用余弦相似度公式计算所述分布式系统集群中与所述检索词相关性最高的实体并返回用户。


2.根据权利要求1所述的检索方法,其特征在于:所述数据信息包括期刊、论文、专利、百科、词典信息,国家官网、企业官网信息以及各专业、职业信息。


3.根据权利要求1所述的检索方法,其特征在于,所述构建文本图谱,包括:
从所述分布式系统集群中提取三元组;
根据三元组构建文本图谱;
将文本图谱保存至数...

【专利技术属性】
技术研发人员:王绪刚
申请(专利权)人:北京欧拉认知智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1