一种智能语义检索方法、系统和电子设备技术方案

技术编号:26597685 阅读:24 留言:0更新日期:2020-12-04 21:19
本发明专利技术提供了一种智能语义检索方法、系统和电子设备。该方法包括:构建索引库,该索引库包括扩展词索引和索引句;接收用户输入的检索语句,并对该检索语句进行关键词提取,以生成至少一个关键词;基于所述关键词,通过查询所述索引库的扩展词索引获得各关键词的扩展词;将所提取的各关键词和各关键词的扩展词作为检索词集,在所述索引库中匹配索引句,获得匹配的索引句列表;计算所述检索词集中各词与所述索引句列表中的各索引句的向量相似度,对所述各索引句进行排序;基于排序靠前的至少一个索引句,获取检索结果。本发明专利技术的方法实现了更智能化的检索,提高了检索效率和准确度,优化了检索方法,还提高了召回率。

【技术实现步骤摘要】
一种智能语义检索方法、系统和电子设备
本专利技术涉及计算机信息处理领域,具体涉及一种智能语义检索方法、系统和电子设备。
技术介绍
随着计算机网络技术的飞速发展,大量丰富的信息为人们生活和工作带来方便,如何准确、快速的获取有用的信息越来越重要。如果计算机能够准确理解用户的需求,它就可以将最符合用户需求的信息检索出来并呈现给用户。准确理解用户的需求在一定程度上就是准确理解用户输入的含义,因而,建立基于语义的检索非常重要,它使计算机的检索更具有智能性,进而实现智能检索。现有的检索模型主要有布尔模型、概率模型和向量空间模型。但无论采用哪种模型,都是基于关键字匹配进行检索的,都不能从根本上解决词的同义和多义问题。此外,现有的语义分析方法可以实现部分的语义检索,但效果不是很理想,语义计算的准确率不高。因此,有必要提供一种更有效的智能语义检索方法。
技术实现思路
为了进一步优化检索方法,本专利技术提供了一种智能语义检索方法,包括:构建索引库,该索引库包括扩展词索引和索引句,扩展词索引包括多个语义相近的词以及这些词的词向量,本文档来自技高网...

【技术保护点】
1.一种智能语义检索方法,其特征在于,包括:/n构建索引库,该索引库包括扩展词索引和索引句,扩展词索引包括多个语义相近的词以及这些词的词向量,索引句为用于召回检索结果的句子,该索引库为每个索引句建立一个句向量,该句向量是索引句中各关键词的词向量的均值;/n接收用户输入的检索语句,并对该检索语句进行关键词提取,以生成至少一个关键词;/n基于所述关键词,通过查询所述索引库的扩展词索引获得各关键词的扩展词;/n将所提取的各关键词和各关键词的扩展词作为检索词集,在所述索引库中匹配索引句,获得匹配的索引句列表;/n计算所述检索词集中各词与所述索引句列表中的各索引句的向量相似度,对所述各索引句进行排序;/...

【技术特征摘要】
1.一种智能语义检索方法,其特征在于,包括:
构建索引库,该索引库包括扩展词索引和索引句,扩展词索引包括多个语义相近的词以及这些词的词向量,索引句为用于召回检索结果的句子,该索引库为每个索引句建立一个句向量,该句向量是索引句中各关键词的词向量的均值;
接收用户输入的检索语句,并对该检索语句进行关键词提取,以生成至少一个关键词;
基于所述关键词,通过查询所述索引库的扩展词索引获得各关键词的扩展词;
将所提取的各关键词和各关键词的扩展词作为检索词集,在所述索引库中匹配索引句,获得匹配的索引句列表;
计算所述检索词集中各词与所述索引句列表中的各索引句的向量相似度,对所述各索引句进行排序;
基于排序靠前的至少一个索引句,获取检索结果。


2.根据权利要求1所述的智能语义检索方法,其特征在于,所述计算所述检索词集中各词与所述索引句列表中的各索引句的向量相似度,对所述各索引句进行排序包括:
基于检索词集中的词在索引句中的命中率和所述相似度的综合评分进行排序。


3.根据权利要求2所述的智能语义检索方法,其特征在于,
所述综合评分等于所述词在索引句中的命中率与第一权重系数的乘积和所述相似度与第二权重系数的乘积之和。


4.根据权利要求3所述的智能语义检索方法,其特征在于,
基于关系重要度的确定,设定第一权重系数和第二权重系数,其中,所述第一权重系数大于所述第二权重系数。


5.根据权利要求4所述的智能语义检索方法,其特征在于,
所述第一权重系数大于0.5,且所述第二权重系数小于0.5。


6.根据权利要求3所述的智能语义检索方法,其特征在于,所述基于...

【专利技术属性】
技术研发人员:李蒙张常睿
申请(专利权)人:北京淇瑀信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1