信息搜索方法、装置、设备及存储介质制造方法及图纸

技术编号:38098351 阅读:12 留言:0更新日期:2023-07-06 09:14
本发明专利技术公开一种信息搜索方法、装置、设备及存储介质。本发明专利技术通过在获取到与检索信息相关的初始检索结果时,从检索信息中提取当前关键词,然后从预设站点图中查找与当前关键词相关的目标站点信息,预设站点图用于表征各站点与关键词之间的对应关系,然后基于目标站点信息对初始检索结果进行信息处理,再对处理后的检索结果进行展示。本发明专利技术通过从预设站点图中查找与当前关键词相关的目标站点信息,能够准确查找到与当前关键词相关的目标站点信息,相较于现有的利用输入的搜索词与标题进行匹配,本发明专利技术能够在获取到初始检索结果后,再基于目标站点信息有效地对初始检索结果进行信息处理,并向用户展示处理后的检索结果,从而能够提高搜索质量。提高搜索质量。提高搜索质量。

【技术实现步骤摘要】
信息搜索方法、装置、设备及存储介质


[0001]本专利技术涉及互联网
,尤其涉及一种信息搜索方法、装置、设备及存储介质。

技术介绍

[0002]在当今信息量爆炸的互联网世界中,网络用户在搜索引擎进行搜索时,搜索引擎后端会通过利用用户输入的搜索词的文本语义信息与页面标题、内容等文本语义信息的匹配程度,返回用户搜索结果。但是在搜索过程中需要进行匹配的数据量过大,会导致搜索质量下降。因此,如何提高搜索质量,成为一个亟待解决的问题。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供了一种信息搜索方法、装置、设备及存储介质,旨在解决如何提高搜索质量的技术问题。
[0005]为实现上述目的,本专利技术提供了一种信息搜索方法,所述方法包括以下步骤:
[0006]在获取到与检索信息相关的初始检索结果时,从所述检索信息中提取当前关键词;
[0007]从预设站点图中查找与所述当前关键词相关的目标站点信息,所述预设站点图用于表征各站点与关键词之间的对应关系;
[0008]基于所述目标站点信息对所述初始检索结果进行信息处理;
[0009]对处理后的检索结果进行展示。
[0010]可选地,所述目标站点信息为目标站点向量;
[0011]所述基于所述目标站点信息对所述初始检索结果进行信息处理的步骤,具体包括:
[0012]基于所述目标站点向量对所述初始检索结果进行信息处理。
[0013]可选地,所述基于所述站点向量对所述初始检索结果进行信息处理的步骤,具体包括:
[0014]获取所述目标站点向量中各站点向量对应的向量大小和向量维度;
[0015]根据所述向量大小和所述向量维度对所述初始检索结果中的各网页信息进行排序处理。
[0016]可选地,所述根据所述向量大小和所述向量维度对所述初始检索结果中的各网页信息进行排序处理的步骤,具体包括:
[0017]根据所述向量维度对所述站点向量进行分类,获得分类后的站点向量;
[0018]根据所述分类后的站点向量中各站点向量对应的向量大小对所述初始检索结果中的各网页信息进行排序处理。
[0019]可选地,所述基于所述站点向量对所述初始检索结果进行信息处理的步骤,具体包括:
[0020]获取所述站点向量中各站点向量对应的向量维度;
[0021]根据所述向量维度和预设异常站点向量对所述初始检索结果中的各网页信息进行筛选处理。
[0022]可选地,所述根据所述向量维度和预设异常站点向量对所述初始检索结果中的各网页信息进行筛选处理的步骤,具体包括:
[0023]获取所述向量维度中大于预设向量维度的目标向量维度;
[0024]获取所述目标向量维度对应站点向量的目标站点,并将所述初始检索结果中的所述目标站点进行删除;
[0025]对剩余的初始检索结果中的异常网页信息进行删除处理。
[0026]可选地,所述从预设站点图中查找与所述当前关键词相关的目标站点信息的步骤,具体包括:
[0027]通过预设图算法对所述预设站点图进行随机游走处理,获得各站点对应的随机游走路径;
[0028]通过预设词向量模型对所述各站点对应的随机游走路径进行数据转换,获得各站点对应的目标站点向量;
[0029]从所述各站点对应的目标站点向量中查找与所述当前关键词相关的目标站点向量。
[0030]可选地,所述在获取到与检索信息相关的初始检索结果时,从所述检索信息中提取当前关键词的步骤之前,还包括:
[0031]获取多个站点对应的历史访问信息;
[0032]根据历史关键词和所述历史访问信息确定预设站点图。
[0033]可选地,所述根据历史关键词和所述历史访问信息确定预设站点图的步骤,具体包括:
[0034]从所述历史访问信息中提取各站点对应的点击信息;
[0035]在所述点击信息中的点击次数满足预设次数条件时,获得目标点击信息;
[0036]将所述目标点击信息对应的站点进行删除,获得剩余站点;
[0037]根据所述剩余站点和所述历史关键词确定目标格式数据;
[0038]根据所述目标格式数据确定预设站点图。
[0039]可选地,所述根据所述目标格式数据确定预设站点图的步骤,具体包括:
[0040]获取所述目标格式数据中的各历史关键词对应的所有剩余站点;
[0041]基于各历史关键词和各历史关键词对应的所有剩余站点构建预设站点图。
[0042]可选地,所述基于各历史关键词和各历史关键词对应的所有剩余站点构建预设站点图的步骤,具体包括:
[0043]获取各剩余站点对应的点击次数和展示信息;
[0044]根据所述点击次数和所述展示信息确定各历史关键词与各历史关键词对应的所有站点之间的结合长度;
[0045]基于各历史关键词、各历史关键词对应的所有站点以及各历史关键词与各历史关
键词对应的所有站点之间的结合长度构建预设站点图。
[0046]此外,为实现上述目的,本专利技术还提供一种信息搜索装置,所述装置包括:
[0047]关键词提取模块,用于在获取到与检索信息相关的初始检索结果时,从所述检索信息中提取当前关键词;
[0048]信息查找模块,用于从预设站点图中查找与所述当前关键词相关的目标站点信息,所述预设站点图用于表征各站点与关键词之间的对应关系;
[0049]信息处理模块,用于基于所述目标站点信息对所述初始检索结果进行信息处理;
[0050]结果展示模块,用于对处理后的检索结果进行展示。
[0051]可选地,所述目标站点信息为目标站点向量;所述信息处理模块,还用于基于所述目标站点向量对所述初始检索结果进行信息处理。
[0052]可选地,所述信息处理模块,还用于获取所述目标站点向量中各站点向量对应的向量大小和向量维度;根据所述向量大小和所述向量维度对所述初始检索结果中的各网页信息进行排序处理。
[0053]可选地,所述信息处理模块,还用于根据所述向量维度对所述站点向量进行分类,获得分类后的站点向量;根据所述分类后的站点向量中各站点向量对应的向量大小对所述初始检索结果中的各网页信息进行排序处理。
[0054]可选地,所述信息处理模块,还用于获取所述站点向量中各站点向量对应的向量维度;根据所述向量维度和预设异常站点向量对所述初始检索结果中的各网页信息进行筛选处理。
[0055]可选地,所述信息处理模块,还用于获取所述向量维度中小于预设向量维度的目标向量维度;获取所述目标向量维度对应站点向量的目标站点,并将所述初始检索结果中的所述目标站点进行删除;对剩余的初始检索结果中的异常网页信息进行删除处理。
[0056]可选地,所述信息查找模块,还用于通过预设图算法对所述预设站点图进行随机游走本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息搜索方法,其特征在于,所述信息搜索方法包括以下步骤:在获取到与检索信息相关的初始检索结果时,从所述检索信息中提取当前关键词;从预设站点图中查找与所述当前关键词相关的目标站点信息,所述预设站点图用于表征各站点与关键词之间的对应关系;基于所述目标站点信息对所述初始检索结果进行信息处理;对处理后的检索结果进行展示。2.如权利要求1所述的信息搜索方法,其特征在于,所述目标站点信息为目标站点向量;所述基于所述目标站点信息对所述初始检索结果进行信息处理的步骤,具体包括:基于所述目标站点向量对所述初始检索结果进行信息处理。3.如权利要求2所述的信息搜索方法,其特征在于,所述基于所述目标站点向量对所述初始检索结果进行信息处理的步骤,具体包括:获取所述目标站点向量中各站点向量对应的向量大小和向量维度;根据所述向量大小和所述向量维度对所述初始检索结果中的各网页信息进行排序处理。4.如权利要求3所述的信息搜索方法,其特征在于,所述根据所述向量大小和所述向量维度对所述初始检索结果中的各网页信息进行排序处理的步骤,具体包括:根据所述向量维度对所述站点向量进行分类,获得分类后的站点向量;根据所述分类后的站点向量中各站点向量对应的向量大小对所述初始检索结果中的各网页信息进行排序处理。5.如权利要求2所述的信息搜索方法,其特征在于,所述基于所述目标站点向量对所述初始检索结果进行信息处理的步骤,具体包括:获取所述站点向量中各站点向量对应的向量维度;根据所述向量维度和预设异常站点向量对所述初始检索结果中的各网页信息进行筛选处理。6.如权利要求5所述的信息搜索方法,其特征在于,所述根据所述向量维度和预设...

【专利技术属性】
技术研发人员:柳煜
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1