The embodiment of the present invention discloses an intelligent retrieval method, device and computer readable storage medium, which processes the acquired document information in clauses to obtain multiple source statements, processes each source statement by using the problem generation model after training, and obtains the corresponding document title; and according to the source statement and its corresponding text. File question and answer question pairs, and document question answering pairs are stored in the knowledge base. According to the preset index rules, each question-and-answer pair is processed to get the corresponding multi-lexical units. When there are questions to be processed, according to each lexical unit, the answers corresponding to the questions to be processed can be quickly found from the knowledge base. The accuracy of the answers can be effectively guaranteed by storing the question-and-answer pairs generated from the document information in the knowledge base, which makes it easier to find the answers based on the knowledge base to meet the needs of users. And through the establishment of vocabulary unit, the retrieval efficiency is effectively enhanced.
【技术实现步骤摘要】
一种智能检索方法、装置和计算机可读存储介质
本专利技术涉及信息检索
,特别是涉及一种智能检索方法、装置和计算机可读存储介质。
技术介绍
随着网络的普及,网络上的信息资源越来越丰富。人们遇到问题,经常会通过网络检索的方式,寻找问题的答案。传统问答系统的知识库的数据源来自于网上的问题和回答,有些答案较为随意,其准确性得不到保障。并且知识库中缺少基于文档作为答案的问答对,使得知识库中包含的数据资源相对有限。依据该知识库进行问题的检索时,得到的答案相对有限,用户可能无法得到所需的答案,导致答案检索的准确率较低。可见,如何快速、准确的获取检索结果,是本领域技术人员亟待解决的问题。
技术实现思路
本专利技术实施例的目的是提供一种智能检索方法、装置和计算机可读存储介质,可以快速、准确的获取检索结果。为解决上述技术问题,本专利技术实施例提供一种智能检索方法,包括:对获取的文档信息进行分句处理,以得到多个源语句;利用训练后的问题生成模型,对各所述源语句进行处理,得到对应的文档题目;根据所述源语句及其对应的文档题目,建立文档问答对,并将所述文档问答对存储于知识库中;其中,所述知识库中还包括有历史问答对;按照预设的索引规则,对所述知识库中包含的各问答对进行处理,得到对应的多个语汇单元;依据各所述语汇单元,从所述知识库中查找与待处理题目相对应的答案。可选的,所述问题生成模型的训练过程包括:获取历史问答对,并将所述历史问答对存储于所述知识库中;利用所述历史问答对训练所述问题生成模型。可选的,所述依据各所述语汇单元,从所述知识库中查找与待处理题目相对应的答案包括:提取待处理题目中的 ...
【技术保护点】
1.一种智能检索方法,其特征在于,包括:对获取的文档信息进行分句处理,以得到多个源语句;利用训练后的问题生成模型,对各所述源语句进行处理,得到对应的文档题目;根据所述源语句及其对应的文档题目,建立文档问答对,并将所述文档问答对存储于知识库中;其中,所述知识库中还包括有历史问答对;按照预设的索引规则,对所述知识库中包含的各问答对进行处理,得到对应的多个语汇单元;依据各所述语汇单元,从所述知识库中查找与待处理题目相对应的答案。
【技术特征摘要】
1.一种智能检索方法,其特征在于,包括:对获取的文档信息进行分句处理,以得到多个源语句;利用训练后的问题生成模型,对各所述源语句进行处理,得到对应的文档题目;根据所述源语句及其对应的文档题目,建立文档问答对,并将所述文档问答对存储于知识库中;其中,所述知识库中还包括有历史问答对;按照预设的索引规则,对所述知识库中包含的各问答对进行处理,得到对应的多个语汇单元;依据各所述语汇单元,从所述知识库中查找与待处理题目相对应的答案。2.根据权利要求1所述的方法,其特征在于,所述问题生成模型的训练过程包括:获取历史问答对,并将所述历史问答对存储于所述知识库中;利用所述历史问答对训练所述问题生成模型。3.根据权利要求1或2所述的方法,其特征在于,所述依据各所述语汇单元,从所述知识库中查找与待处理题目相对应的答案包括:提取待处理题目中的关键词;从预先建立的各所述语汇单元中查询与所述关键词相对应的目标语汇单元;从所述知识库中获取所述目标语汇单元所对应的候选题目;利用RankSVM模型,对所述候选题目进行相似度排序;选取相似度分数最高的候选题目作为目标题目;并将所述目标题目对应的答案作为所述待处理题目的答案。4.根据权利要求3所述的方法,其特征在于,所述从预先建立的各所述语汇单元中查询与所述关键词相对应的目标语汇单元包括:判断各语汇单元中是否包含有与所述关键词相匹配的词;若是,则将所述语汇单元作为初始语汇单元;依据各所述初始语汇单元中与所述关键词相匹配的词的个数,确定出各所述初始语汇单元对应的关键词分数;将关键词分数大于预设分数值的初始语汇单元作为目标语汇单元。5.根据权利要求3所述的方法,其特征在于,所述利用RankSVM模型,对所述候选题目进行相似度排序包括:依据预先设定的特征提取规则,计算出所述待处理题目与各所述候选题目之间的特征参数;将所述特征参数输入到所述RankSVM模型,以得到...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。