The invention discloses an information retrieval method and a device, belonging to the field of the Internet, in order to improve the accuracy of the result of the problem to be solved by the user to be retrieved. The method comprises: receiving input to solve problems; technical field to solve the problem is to determine the; according to the technology in the field of the knowledge base is established beforehand, to solve the problem of matching the target document, and the determination of the technical field which includes the relationship between the relationship between the problem of object, knowledge object, document object, the object and the object of knowledge and knowledge of the object and the document object of the knowledge base, a part of the knowledge object selected from the object returned by the target document. This application is used to answer questions to be answered.
【技术实现步骤摘要】
信息检索方法和装置
本申请涉及互联网领域,特别涉及一种信息检索方法和装置。
技术介绍
随着互联网的高速发展,用户当前越来越多的倾向于通过在互联网上提问来获取问题的答案。搜索引擎在获取到用户的提问后,会基于提问中出现的一或多个关键词进行检索,并返回与所述一或多个关键词匹配的结果。然而,对于机器来说,理解人类的一个问题是一件很困难的事情,通过上述这种方式获取到的结果很可能并不是用户提问想要获取的结果,从而造成检索准确率偏低。
技术实现思路
本申请实施例提供了一种信息检索方法和装置,以提高检索出的用户待解决问题的结果的准确性。所述技术方案如下:一方面,提供了一种信息检索方法,所述方法包括:接收输入的待解决问题;确定所述待解决问题所属的
;根据预先建立的在所述
的知识库,确定所述
中与所述待解决问题相匹配的目标文档,其中,所述知识库中包括问题对象、知识对象、文档对象、所述问题对象和所述知识对象之间的对应关系以及所述知识对象和所述文档对象之间的对应关系,所述知识对象选自所述问题对象的一部分;返回所述目标文档。另一方面,提供了一种信息检索装置,所述信息检索装置包括:界面模块,用于接收输入的待解决问题;处理模块,用于确定所述待解决问题所属的
;所述处理模块,还用于根据预先建立的在所述
的知识库,确定所述
中与所述待解决问题相匹配的目标文档,其中,所述知识库中包括问题对象、知识对象、文档对象、所述问题对象和所述知识对象之间的对应关系以及所述知识对象和所述文档对象之间的对应关系,所述知识对象选自所述问题对象的一部分;所述界面模块,还用于返回所 ...
【技术保护点】
一种信息检索方法,其特征在于,所述方法包括:接收输入的待解决问题;确定所述待解决问题所属的技术领域;根据预先建立的在所述技术领域的知识库,确定所述技术领域中与所述待解决问题相匹配的目标文档,其中,所述知识库中包括问题对象、知识对象、文档对象、所述问题对象和所述知识对象之间的对应关系以及所述知识对象和所述文档对象之间的对应关系,所述知识对象选自所述问题对象的一部分;返回所述目标文档。
【技术特征摘要】
1.一种信息检索方法,其特征在于,所述方法包括:接收输入的待解决问题;确定所述待解决问题所属的技术领域;根据预先建立的在所述技术领域的知识库,确定所述技术领域中与所述待解决问题相匹配的目标文档,其中,所述知识库中包括问题对象、知识对象、文档对象、所述问题对象和所述知识对象之间的对应关系以及所述知识对象和所述文档对象之间的对应关系,所述知识对象选自所述问题对象的一部分;返回所述目标文档。2.根据权利要求1所述的方法,其特征在于,所述与所述待解决问题相匹配的目标文档为解决所述待解决问题的目标文档;所述返回所述目标文档包括:返回所述目标文档的名称和/或返回所述目标文档中的内容。3.根据权利要求1所述的方法,其特征在于,所述确定所述技术领域中与所述待解决问题相匹配的技术文档包括:根据所述知识库中所述问题对象、所述知识对象以及所述问题对象和所述知识对象之间的对应关系,确定所述技术领域中与所述待解决问题类似的问题;确定每个所述类似的问题与所述待解决问题之间的相似度得分;基于所述相似度得分,以及每个所述类似的问题对应的目标文档,确定与所述待解决问题相匹配的目标文档。4.根据权利要求3所述的方法,其特征在于,每个所述类似的问题对应的目标文档作为候选文档,所述基于所述相似度得分以及每个所述类似的问题对应的目标文档,确定与所述待解决问题相匹配的目标文档包括:基于所述相似度得分,确定所述待解决问题与所述候选文档中的每一个的相似度;按照所述待解决问题与所述候选文档之间相似度从高到低的顺序选择一或多个候选文档作为与所述待解决问题相匹配的目标文档;其中,以如下方式确定所述待解决问题与所述候选文档中的每一个的相似度:q表示待解决问题,d表示一个候选文档,score(q,d)表示待解决问题q和候选文档d之间的相似度,#(d,C)表示d在C中出现的总次数,#(d,C0)表示d在C0中出现的次数,(q’i,d)∈C0表示d能解决在C0中的问题q’i,score(q’i,q)表示q’i与q的相似度得分;且C0表示问题日志C的子集,q’表示与待解决问题q类似的问题,且C0={(q′0,d′0),{(q′1,d′1),...,{q′m,d′m)},q’i表示第i个与q类似的问题,m表示与q类似的问题的总数,d’表示与q’对应的目标文档。5.根据权利要求1-4任一所述的方法,其特征在于,在确定目标文档之后,所述方法还包括:基于随机游走算法,计算所述待解决问题与所述知识库中的每一个文档对象的相似度;基于所述待解决问题与所述知识库中的每一个文档对象的相似度,对所述多个目标文档进行重排序。6.根据权利要求5所述的方法,其特征在于,所述基于随机游走算法,计算所述待解决问题与所述知识库中的每一个文档对象的相似度包括:选择所述待解决问题与所述文档对象之间的一或多个节点设置索引,其中,所述节点的索引表示该节点到所述知识库中的各个文档对象的相似度;基于为所述一或多个节点设置的所述索引,计算所述待解决问题与所述知识库中的每一个文档对象的相似度。7.根据权利要求6所述的方法,其特征在于,选择设置索引的节点包括:选择路径上的频繁节点设置索引,其中,频繁节点为入度和出度的乘积大于阈值的节点。8.一种信息检索装置,其特征在于...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。