信息检索方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:18763838 阅读:25 留言:0更新日期:2018-08-25 10:30
本申请涉及一种信息检索方法、系统、计算机设备和存储介质。该方法包括:获取目标问题;获取预设的多个检索路径以及每个检索路径对应的调用顺序;根据调用顺序获取第一顺序的检索路径,利用获取到的检索路径对目标问题进行检索,得到临时信息库;临时信息库包括多个信息对,信息对包括检索结果;计算多个信息对中每个检索结果与目标问题的相似度;检测是否存在与目标问题的相似度达到阈值的信息对;若不存在,根据调用顺序获取下一顺序的检索路径,返回利用获取到的检索路径对目标问题进行检索的步骤;若存在,抽取相似度达到阈值的检索结果作为目标结果,展示目标结果。采用本方法能够提高信息检索效率及准确度。

【技术实现步骤摘要】
信息检索方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种信息检索方法、装置、计算机设备和存储介质。
技术介绍
通常地,利用传统的搜索引擎,可以从互联网上浏览和检索到我们所需要的信息,为我们的生活带来很大的便利。但是,由于它们查询的基础是关键词,并非我们常用的自然语言,搜索引擎仅仅缩小了用户的查找范围,却很少能直接给出用户想要的答案,用户必须自己从海量相关信息中寻找答案,使得信息检索的效率以及准确性均不高。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高信息检索效率及准确性的信息检索方法、装置、计算机设备和存储介质。一种信息检索方法,所述方法包括:接收用户的信息检索请求,所述信息检索请求携带了目标问题;获取预设的多个检索路径以及每个所述检索路径对应的调用顺序;根据所述调用顺序获取第一顺序的检索路径,利用获取到的检索路径对所述目标问题进行检索,得到临时信息库;所述临时信息库包括多个信息对,所述信息对包括检索结果;计算多个信息对中每个检索结果与所述目标问题的相似度;检测是否存在与所述目标问题的相似度达到阈值的信息对;当不存在与所述目标问题的相似度达到阈值的信息对时,根据所述调用顺序获取下一顺序的检索路径,返回所述利用获取到的检索路径对所述目标问题进行检索的步骤;当存在与所述目标问题的相似度达到阈值的信息对时,抽取所述相似度达到阈值的检索结果作为目标结果,展示所述目标结果。在其中一个实施例,所述信息对还包括所述检索结果对应的关联问题,确定多个信息对中每个检索结果与所述目标问题的相似度的步骤,包括:识别所述目标问题的问题类别;识别多个关联问题的问题类别;根据所述关联问题的问题类别和所述目标问题的问题类别,对所述信息对进行过滤;计算过滤得到的多个信息对中每个检索结果与所述目标问题的相似度。在其中一个实施例,识别所述目标问题的问题类别的步骤,包括:对所述目标问题进行预处理,得到所述目标问题对应的目标关键词;获取预设的多个问题类别以及每个问题类别对应的多个词袋,所述词袋包括多个预设关键词;将所述目标关键词与多个词袋中的预设关键词进行匹配;当所述目标问题包含了一个词袋时,根据相匹配的词袋对应的问题类别对所述目标问题进行分类;当所述目标问题包含了多个词袋时,根据相匹配的多个词袋包含预设关键词的数量和/或权重确定相匹配的多个词袋的优先级,根据相匹配的多个词袋包含预设关键词的数量和/或权重确定相匹配的多个词袋的优先级。在其中一个实施例,对所述目标问题进行预处理的步骤,包括:对所述目标问题进行拆分处理,得到对应的多个目标分词;所述目标分词包括停用词或标点符号;对多个目标分词进行过滤,删除所述停用词和所述标点符号;对过滤后的多个目标分词进行同义词替换;对过滤后的多个目标分词进行命名实体替换。在其中一个实施例,在获取预设的多个问题类别以及每个问题类别对应的多个词袋的步骤之前,还包括:获取问题语料;所述问题语料包括多个问题类别以及每个问题类别对应的多个预设问题;对多个预设问题进行预处理,得到每个预设问题对应的一个或多个中间关键词;计算每个中间关键词的TF-IDF值,根据所述TF-IDF值对多个中间关键词进行筛选,将筛选得到的多个中间关键词作为预设关键词;利用每个预设问题对应的一个或多个预设关键词,生成相应预设问题的词袋,将所述词袋与相应的问题类别进行关联。在其中一个实施例,根据TF-IDF值对多个中间关键词进行筛选,将筛选得到的多个中间关键词作为预设关键词的步骤,包括:根据所述TF-IDF值对多个中间关键词进行排序;按照排序对多个中间关键词进行遍历,若当前顺序的中间关键词的TF-IDF值超过预设倍数的下一顺序中间关键词的TF-IDF值,将所述当前顺序的中间关键词与所述下一顺序中间关键词之间的位置作为截取位置;根据所述截取位置截取排序靠前的多个中间关键词,将截取到的多个中间关键词作为预设关键词。在其中一个实施例,所述方法还包括:获取多个目标结果的满意度反馈;对所述满意度反馈进行大数据分析;根据大数据分析结果对所述阈值和/或多个检索路径的调用顺序进行调整。一种问答收取装置,所述装置包括:检索请求模块,用于接收用户的信息检索请求,所述信息检索请求携带了目标问题;多路径检索模块,用于获取预设的多个检索路径以及每个所述检索路径对应的调用顺序;根据所述调用顺序获取第一顺序的检索路径,利用获取到的检索路径对所述目标问题进行检索,得到临时信息库;所述临时信息库包括多个信息对,所述信息对包括检索结果;结果提取模块,用于计算多个信息对中每个检索结果与所述目标问题的相似度;检测是否存在与所述目标问题的相似度达到阈值的信息对;当不存在与所述目标问题的相似度达到阈值的信息对时,根据所述调用顺序获取下一顺序的检索路径,返回所述利用获取到的检索路径对所述目标问题进行检索的步骤;当存在与所述目标问题的相似度达到阈值的信息对时,抽取所述相似度达到阈值的检索结果作为目标结果,展示所述目标结果。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项方法的步骤。上述信息检索方法、装置、计算机设备和存储介质,接收到终端发送的目标问题后,对目标问题进行最新检索,相对传统的在预先存储的问答库中进行检索可以提高信息检索的准确性;在按照上述方式对目标问题进行准确分类的前提下,利用关联问题与目标问题的问题类别对检索得到的信息对进行一级过滤,可以缩小目标结果的筛选范围,从而可以提高信息检索效率;利用检索结果与目标问题的相似度对检索得到的信息对进行二级过滤,可以逐步筛选出符合用户需求的目标结果;利用预设的多个检索路径对目标问题进行多层级检索,直至能够在检索到的多个关联问题中提取到与目标问题相似度符合条件的目标结果,相对传统的在单一检索路径进行检索,确保检索到符合用户需求的目标结果才进行返回,从而可以进一步提高信息检索的准确性。附图说明图1为一个实施例中信息检索方法的应用场景图;图2为一个实施例中信息检索方法的流程示意图;图3为一个实施例中信息检索方法的问题分类步骤的流程示意图;图4为另一个实施例中多个中间关键词的IF-IDF值的变化规律示意图;图5为一个实施例中信息检索装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的信息检索方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。其中,终端102可以是个人计算机、笔记本电脑、智能手机、平板电脑或便携式可穿戴设备中的至少一种,但并不局限于此。服务器104可以是独立的物理服务器,也可以是多个物理服务器组成的服务器集群。当用户需要进行信息检索时,可以在终端102录入目标问题。终端102利用用户输入的目标问题生成信息检索请求,将信息检索请求发送至服务器104。服务器104预先存储了多个检索本文档来自技高网...

【技术保护点】
1.一种信息检索方法,所述方法包括:接收用户的信息检索请求,所述信息检索请求携带了目标问题;获取预设的多个检索路径以及每个所述检索路径对应的调用顺序;根据所述调用顺序获取第一顺序的检索路径,利用获取到的检索路径对所述目标问题进行检索,得到临时信息库;所述临时信息库包括多个信息对,所述信息对包括检索结果;计算多个信息对中每个检索结果与所述目标问题的相似度;检测是否存在与所述目标问题的相似度达到阈值的信息对;当不存在与所述目标问题的相似度达到阈值的信息对时,根据所述调用顺序获取下一顺序的检索路径,返回所述利用获取到的检索路径对所述目标问题进行检索的步骤;当存在与所述目标问题的相似度达到阈值的信息对时,抽取所述相似度达到阈值的检索结果作为目标结果,展示所述目标结果。

【技术特征摘要】
1.一种信息检索方法,所述方法包括:接收用户的信息检索请求,所述信息检索请求携带了目标问题;获取预设的多个检索路径以及每个所述检索路径对应的调用顺序;根据所述调用顺序获取第一顺序的检索路径,利用获取到的检索路径对所述目标问题进行检索,得到临时信息库;所述临时信息库包括多个信息对,所述信息对包括检索结果;计算多个信息对中每个检索结果与所述目标问题的相似度;检测是否存在与所述目标问题的相似度达到阈值的信息对;当不存在与所述目标问题的相似度达到阈值的信息对时,根据所述调用顺序获取下一顺序的检索路径,返回所述利用获取到的检索路径对所述目标问题进行检索的步骤;当存在与所述目标问题的相似度达到阈值的信息对时,抽取所述相似度达到阈值的检索结果作为目标结果,展示所述目标结果。2.根据权利要求1所述的方法,其特征在于,所述信息对还包括所述检索结果对应的关联问题,确定多个信息对中每个检索结果与所述目标问题的相似度的步骤,包括:识别所述目标问题的问题类别;识别多个关联问题的问题类别;根据所述关联问题的问题类别和所述目标问题的问题类别,对所述信息对进行过滤;计算过滤得到的多个信息对中每个检索结果与所述目标问题的相似度。3.根据权利要求2所述的方法,其特征在于,识别所述目标问题的问题类别的步骤,包括:对所述目标问题进行预处理,得到所述目标问题对应的目标关键词;获取预设的多个问题类别以及每个问题类别对应的多个词袋,所述词袋包括多个预设关键词;将所述目标关键词与多个词袋中的预设关键词进行匹配;当所述目标问题包含了一个词袋时,根据相匹配的词袋对应的问题类别对所述目标问题进行分类;当所述目标问题包含了多个词袋时,根据相匹配的多个词袋包含预设关键词的数量和/或权重确定相匹配的多个词袋的优先级,根据相匹配的多个词袋包含预设关键词的数量和/或权重确定相匹配的多个词袋的优先级。4.根据权利要求3所述的方法,其特征在于,对所述目标问题进行预处理的步骤,包括:对所述目标问题进行拆分处理,得到对应的多个目标分词;所述目标分词包括停用词或标点符号;对多个目标分词进行过滤,删除所述停用词和所述标点符号;对过滤后的多个目标分词进行同义词替换;对过滤后的多个目标分词进行命名实体替换。5.根据权利要求3所述的方法,其特征在于,在获取预设的多个问题类别以及每个问题类别对应的多个词袋的步骤之前,还包括:获取问题语料;所述问题语料包括多个问题类别以...

【专利技术属性】
技术研发人员:康平陆杨新宇陈钦明
申请(专利权)人:深圳市阿西莫夫科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1