【技术实现步骤摘要】
语义检索方法、装置、设备以及存储介质
本申请实施例涉及计算机领域,具体涉及知识图谱、深度学习和自然语言处理等人工智能领域,尤其涉及语义检索方法、装置、设备以及存储介质。
技术介绍
随着人工智能的普及和发展,在互联网海量信息中,用户经常需要通过搜索引擎来检索需要的信息,然而目前搜索引擎的检索效果并不是很理想,无法完全理解用户的查询信息。目前的语义检索方法大多还是把用户的查询信息当做只包含实体名称的信息,直接模糊检索进行匹配;或者是只对查询信息进行分词,利用相关性进行判定,导致无法真正理解用户的查询信息,从而导致比较高的错误率。
技术实现思路
本申请实施例提出了一种语义检索方法、装置、设备以及存储介质。第一方面,本申请实施例提出了一种语义检索方法,包括:接收查询信息,基于预先构建的知识图谱对查询信息进行序列标注,得到序列标注结果,其中,序列标注结果包括知识图谱既定信息部分及语义检索部分;基于知识图谱构建符合序列标注结果的候选实体集合;将候选实体集合中的实体与序列标注结果中的语义检索部分进行语义 ...
【技术保护点】
1.一种语义检索方法,包括:/n接收查询信息,基于预先构建的知识图谱对所述查询信息进行序列标注,得到序列标注结果,其中,所述序列标注结果包括知识图谱既定信息部分及语义检索部分;/n基于所述知识图谱构建符合所述序列标注结果的候选实体集合;/n将所述候选实体集合中的实体与所述序列标注结果中的语义检索部分进行语义匹配,得到语义相关度高于预设阈值的实体集合。/n
【技术特征摘要】
1.一种语义检索方法,包括:
接收查询信息,基于预先构建的知识图谱对所述查询信息进行序列标注,得到序列标注结果,其中,所述序列标注结果包括知识图谱既定信息部分及语义检索部分;
基于所述知识图谱构建符合所述序列标注结果的候选实体集合;
将所述候选实体集合中的实体与所述序列标注结果中的语义检索部分进行语义匹配,得到语义相关度高于预设阈值的实体集合。
2.根据权利要求1所述的方法,其中,所述接收查询信息,基于预先构建的知识图谱对所述查询信息进行序列标注,得到序列标注结果,包括:
接收查询信息,利用预先构建的知识图谱和预训练序列标注模型对所述查询消息进行序列标注,得到第一标注结果;
对所述第一标注结果进行修正,得到所述序列标注结果。
3.根据权利要求2所述的方法,其中,所述对所述第一标注结果进行修正,得到所述序列标注结果,包括:
基于自然语言处理分词工具对所述第一标注结果的语义检索部分进行分词,得到第一语义检索部分;
基于自然语言处理专名识别工具对所述第一语义检索部分进行专名修正,得到第二语义检索部分;
基于自然语言处理依存分析工具对所述第一标注结果的知识图谱既定信息部分和所述第二语义检索部分中的各个序列标注部分之间的依赖关系进行判定修正,得到第二标注结果;
基于所述知识图谱对所述第二标注结果进行修正,得到所述序列标注结果。
4.根据权利要求3所述的方法,其中,所述将所述候选实体集合中的实体与所述序列标注结果中的语义检索部分进行语义匹配,得到语义相关度高于预设阈值的实体集合,包括:
基于预训练双塔语义匹配模型将所述候选实体集合中的实体与所述序列标注结果中的语义检索部分进行语义匹配,得到所述实体与所述语义检索部分的语义相关度;
将所述语义相关度与预设阈值进行比较,得到所述语义相关度高于所述预设阈值的实体集合。
5.根据权利要求4所述的方法,其中,所述预训练双塔语义匹配模型的输入源包括:
所述语义检索部分的语义检索词和所述知识图谱的实体信息。
6.一种语义检索装置,包括:
标注模块,被配置成接收查询信息,基于预先构建的知识图谱对所述查询信息进行序列标注,得到序列标注结果,其中,所述序列标注结果包括知识图谱既定信息部分及语义检索部分;
构建模块,被配...
【专利技术属性】
技术研发人员:林泽南,卢佳俊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。