【技术实现步骤摘要】
文档查询方法、装置、存储介质及电子设备
本专利技术涉及文档查询
,特别是涉及文档查询方法、装置、存储介质及电子设备。
技术介绍
随着电子化办公的普及,各种文档越来越多。用户常需要查询某些文档。当前对文档的查询一般直接根据用户输入的检索词在文档中进行全文查询,当某个文档中包括有检索词时,则将该文档作为查询结果输出。但是,全文查询的查询速度较慢。
技术实现思路
本专利技术实施例的目的在于提供一种文档查询方法、装置、存储介质及电子设备,以提高查询速度。具体技术方案如下:一种文档查询方法,包括:获得用户输入的目标词组;获得所述目标词组的相似词组,将所述相似词组和所述目标词组确定为待查询词组;在预先构建的知识图谱中查询与所述待查询词组对应的关键词节点,当查询到与所述待查询词组对应的关键词节点时,获得与查询到的所述关键词节点具有直接连接关系的文档节点;将获得的至少一个文件节点对应的文档确定为查询结果。可选的,所述获得所述目标词组的相似词组,包括:< ...
【技术保护点】
1.一种文档查询方法,其特征在于,包括:/n获得用户输入的目标词组;/n获得所述目标词组的相似词组,将所述相似词组和所述目标词组确定为待查询词组;/n在预先构建的知识图谱中查询与所述待查询词组对应的关键词节点,当查询到与所述待查询词组对应的关键词节点时,获得与查询到的所述关键词节点具有直接连接关系的文档节点;/n将获得的至少一个文件节点对应的文档确定为查询结果。/n
【技术特征摘要】
1.一种文档查询方法,其特征在于,包括:
获得用户输入的目标词组;
获得所述目标词组的相似词组,将所述相似词组和所述目标词组确定为待查询词组;
在预先构建的知识图谱中查询与所述待查询词组对应的关键词节点,当查询到与所述待查询词组对应的关键词节点时,获得与查询到的所述关键词节点具有直接连接关系的文档节点;
将获得的至少一个文件节点对应的文档确定为查询结果。
2.根据权利要求1所述的方法,其特征在于,所述获得所述目标词组的相似词组,包括:
获得所述目标词组的词向量;
在所述目标词组对应的领域的预设词向量字典中,获得与所述目标词组的词向量的相似度满足预设相似度要求的词组,将所述预设相似度要求的词组确定为所述目标词组的相似词组。
3.根据权利要求1所述的方法,其特征在于,所述预先构建的知识图谱为所述目标词组对应的领域的知识图谱,和/或,所述关键词节点位于与所述关键词节点具有直接连接关系的文档节点对应的文档中。
4.根据权利要求1所述的方法,其特征在于,所述在预先构建的知识图谱中查询与所述待查询词组对应的关键词节点,当查询到与所述待查询词组对应的关键词节点时,获得与查询到的所述关键词节点具有直接连接关系的文档节点,包括:
使用所述待查询词组构建知识图谱查询语句,执行所述知识图谱查询语句,其中,所述知识图谱查询语句用于:
在预先构建的知识图谱中查询与所述待查询词组对应的关键词节点,并在查询到与所述待查询词组对应的关键词节点时,获得与查询到的所述关键词节点具有直接连接关系的文档节点。
5.根据权利要求1所述的方法,其特征在于,所述预先构建的知识图谱的构建过程包括:
获得多个文档;
对所述文档进行分词处理,获得多个词组;
将所述多个词组中的停用词去除;
通过预设关键词抽取算法,从去除所述停用词后的所述...
【专利技术属性】
技术研发人员:俞宣伊,黄荣,刘俊峰,谭文静,孙丽黎,初娜,熊浩,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。