【技术实现步骤摘要】
文档查询方法、装置、电子设备和可读存储介质
[0001]本公开涉及计算机
,尤其涉及自然语言处理、知识图谱、深度学习等人工智能
提供了一种文档查询方法、装置、电子设备和可读存储介质。
技术介绍
[0002]现有技术在根据查询词进行文档查询时,通常仅会根据查询词中的每个分词在文档中的统计结果来确定用于推荐的文档,由于分词在文档中的统计结果仅能够反映有限的的推荐信息,因此导致现有技术所查询得到的文档的准确性较低。
技术实现思路
[0003]根据本公开的第一方面,提供了一种文档查询方法,包括:获取查询词,切分所述查询词得到至少一个分词;根据所述查询词,获取所述至少一个分词的意图权重;根据所述至少一个分词得到多个候选文档,获取所述至少一个分词对应于每个候选文档的统计权重;根据所述至少一个分词的意图权重与所述至少一个分词对应于每个候选文档的统计权重,确定每个候选文档的推荐分值;根据所述推荐分值从所述多个候选文档中选取至少一个目标文档,将所述至少一个目标文档作为所述查询词的文档查询结果。
[0004 ...
【技术保护点】
【技术特征摘要】
1.一种文档查询方法,包括:获取查询词,切分所述查询词得到至少一个分词;根据所述查询词,获取所述至少一个分词的意图权重;根据所述至少一个分词得到多个候选文档,获取所述至少一个分词对应于每个候选文档的统计权重;根据所述至少一个分词的意图权重与所述至少一个分词对应于每个候选文档的统计权重,确定每个候选文档的推荐分值;根据所述推荐分值从所述多个候选文档中选取至少一个目标文档,将所述至少一个目标文档作为所述查询词的文档查询结果。2.根据权利要求1所述的方法,其中,所述根据所述查询词,获取所述至少一个分词的意图权重包括:将所述查询词输入意图权重获取模型;将所述意图权重获取模型针对输入的所述查询词中至少一个分词所输出的输出结果,作为所述至少一个分词的意图权重。3.根据权利要求1所述的方法,其中,所述根据所述查询词,获取所述至少一个分词的意图权重包括:获取所述查询词的语义信息与所述至少一个分词的语义信息;针对每个分词,计算该分词的语义信息与所述查询词的语义信息之间的相似度;将计算得到的相似度,作为所述至少一个分词的意图权重。4.根据权利要求1
‑
3中任一项所述的方法,其中,所述根据所述至少一个分词得到多个候选文档包括:根据词语与文档列表之间的对应关系,确定所述至少一个分词对应的文档列表;将所述文档列表中包含的文档,作为所述多个候选文档。5.根据权利要求1
‑
4中任一项所述的方法,其中,所述根据所述至少一个分词的意图权重与所述至少一个分词对应于每个候选文档的统计权重,确定每个候选文档的推荐分值包括:针对每个候选文档,根据每个分词对应于该候选文档的统计权重与每个分词的意图权重,得到每个分词对应于该候选文档的最终权重;根据所述查询词中包含的全部分词的最终权重,确定该候选文档的推荐分值。6.根据权利要求5所述的方法,其中,所述根据所述查询词中包含的全部分词的最终权重,确定该候选文档的推荐分值包括:根据该候选文档的文档字数,获取该候选文档的文档系数;根据所述查询词中包含的全部分词的最终权重与所述文档系数,确定该候选文档的推荐分值。7.一种文档查询装置,包括:获取单元,用于获取查询词,切分所述查询词得到至少一个分词;第一处理单元,用于根据所述查询词,获取所述至少一个分词的意图权重;第二处理单元,用于根据所述至少一个分词得到多个候选文档,获取所述至少一个分词对应于每个候选文档的统计权重;
确定单元,用于根据所述至少一个分词的意图权重与所述至少一个分词对应于每个候选文档的统计权重,确定每个候选文档的推荐分值...
【专利技术属性】
技术研发人员:郭辰阳,时鸿剑,李斐斐,吴学谦,冯欣伟,王志华,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。