信息搜索方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26171330 阅读:22 留言:0更新日期:2020-10-31 13:43
本发明专利技术实施例公开了一种信息搜索方法、装置、计算机设备及存储介质,应用于计算机技术领域,所述信息搜索方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。所述信息搜索方法能够在查询到与所述第一关键词满足相似度条件的第一信息的基础上,还会将所述第一关键词与第一信息中的关键字段进行语义匹配,得到最终的匹配结果,使得搜索得到的信息更加准确。

Information search method, device, computer equipment and storage medium

The embodiment of the invention discloses an information search method, device, computer equipment and storage medium, which is applied in the field of computer technology. The information search method includes: obtaining the first keyword; querying the information base to obtain the first information meeting the similarity condition with the first keyword; extracting the key field in the first information; and combining the key field with the first key word A keyword is matched semantically to obtain a matching result, and a search result is returned based on the matching result. The information search method can, on the basis of finding the first information that meets the similarity condition with the first keyword, also carry out semantic matching between the first keyword and the key fields in the first information to obtain the final matching result, so as to make the information obtained by the search more accurate.

【技术实现步骤摘要】
信息搜索方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种信息搜索方法、装置、计算机设备及存储介质。
技术介绍
目前的搜索技术中,针对信息的搜索,往往只是通过搜索关键词在网络上进行搜索,找到包含有该关键词的相关信息,然而,在搜索到的相关信息中存在大量与搜索关键词不相关的信息,导致利用传统的信息搜索方法得到的搜索的结果往往不尽人意。因此通过搜索关键词能够获得更为准确的搜索结果成为亟需解决的问题。
技术实现思路
本专利技术实施例提供了一种信息搜索方法、装置、计算机设备及存储介质。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种信息搜索方法,所述方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。上述方案中,所述查询信息库获得与所述第一关键词满足相似条件的第一信息,包括:将第一关键词与信息库的第二信息进行语义聚类,得到聚类结果;基于所述聚类结果,从所述第二信息中选择出与所述第一关键词的语义满足相似度条件的第一信息。上述方案中,所述将所述第一关键词与所述信息库的第二信息进行语义聚类,得到聚类结果,包括:将所述第一关键词转换成第一语义向量;将所述第一语义向量与所述第二信息的第二语义向量进行语义聚类,获得聚类结果;<br>所述基于所述聚类结果,从所述第二信息中选择出与所述第一关键词的语义满足相似度条件的第一信息,包括:根据所述聚类结果,从所述第二语义向量中选择出与所述第一语义向量满足所述相似度条件的第三语义向量;根据所述第三语义向量所对应的信息,确定与所述第一关键词满足相似度条件的第一信息。上述方案中,所述提取所述第一信息中的关键字段,包括:将所述第一信息拆分成多个字段;获取任意两个字段之间的语义相似度;基于任意两个字段之间的语义相似度,确定所述语义相似度大于阈值的字段集;根据所述字段集的字段数量,对所述字段集进行排序,得到第一排序结果;根据所述第一排序结果,选出排在前预定位数上对应的字段集;将选出的所述字段集对应的字段作为所述第一信息中的关键字段。上述方案中,所述将所述第一关键词与信息库的第二信息进行语义聚类,得到聚类结果,包括:对所述第一关键词进行扩充处理,得到第二关键词;其中,所述对所述第一关键词进行扩充处理,包括以下至少之一:对所述第一关键词进行同义词扩充;对所述第一关键词进行近义词扩充;对所述第一关键词进行反义词扩充;将所述第二关键词与信息库的第二信息进行语义聚类,得到聚类结果。上述方案中,所述将所述第一关键词与信息库的第二信息进行语义聚类,得到聚类结果,包括:对所述第一关键词进行分词处理,得到第三关键词;将所述第三关键词与信息库的第二信息进行语义聚类,得到聚类结果。上述方案中,所述将所述第一语义向量与所述第二信息的第二语义向量进行语义聚类,获得聚类结果,包括:将所述第二信息的第二语义向量进行降维处理,得到降维的第二语义向量;将所述第一语义向量与所述降维的第二语义向量进行聚类,获得聚类结果。上述方案中,所述基于所述匹配结果,返回搜索结果,包括:根据所述匹配结果,对所述第一信息按照匹配的相似度进行排序,得到第二排序结果;根据所述第二排序结果,确定所述第一信息在客户端界面的显示顺序;将所述显示顺序发送至客户端,所述显示顺序用于供所述客户端按照所述显示顺序显示所述第一信息。本专利技术实施例还提供一种信息搜索装置,所述装置包括:获取模块,用于获取第一关键词;查询模块,用于根据查询信息库获得与所述第一关键词满足相似条件的第一信息;提取模块,用于提取所述第一信息中的关键字段;匹配模块,用于将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;返回模块,用于基于所述匹配结果,返回搜索结果。本专利技术实施例还提供一种计算机设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中所述处理器用于运行所述计算机程序时,实现如上述所述的信息搜索方法。本专利技术实施例还提供一种计算机存储介质,存储有可执行程序,所述可执行程序被处理器执行时,实现如上述所述的信息搜索方法。上述实施例所提供的信息搜索方法、装置、计算机设备及存储介质,通过获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。也就是说,上述实施例能够基于所述第一关键词对信息库中的信息内容进行两次匹配,第一次是利用所述第一关键词查找信息库中与所述第一关键词满足相似条件的第一信息;第二次是将查找出来的第一信息的关键字段与所述第一关键词进行匹配,得到的匹配结果,如此一来,首先通过第一次搜索得到与所述第一关键词匹配并满足相似度条件的第一信息,然后再根据提取的所述第一信息的关键字段,将所述关键字段与所述第一关键词匹配,得到匹配结果,来获得与第一关键词更为匹配的第一信息,从而使得搜索结果更为准确,提升了用户体验。附图说明图1为本专利技术实施例所提供的信息搜索方法的流程示意图;图2为本专利技术具体实施例所提供的信息搜索方法的流程示意图;图3为本专利技术具体实施例所提供的信息搜索方法中主题向量表达模型的图形表示示意图;图4为本专利技术具体实施例所提供的信息搜索方法的另一流程示意图;图5为本专利技术实施例所提供的信息搜索装置的功能结构示意图;图6为本专利技术实施例所提供的计算机设备的硬件结构示意图。具体实施方式以下结合附图及实施例,对本专利技术实施例进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。本专利技术实施例提供的信息搜索方法,应用于计算机设备中,其中,所述计算机设备可以是客户端、服务器,其中,客户端可以包括手机、平板电脑、可穿戴式设备;服务器可以包括:网络服务器、代理服务器、应用程序服务器等。实际上,所述信息搜索方法主要应用于信息搜索的相关应用软件所承载的客户端或相关应用软件的服务商所提供的服务器中。例如与文本信息搜索的相关应用软件包括新闻类应用软件,可在该新闻类应用软件的应用界面搜索新闻文本信息。可以理解的是,用户在使用某一款信息搜索软件进行信息搜索时,计算机设备往往会基本文档来自技高网
...

【技术保护点】
1.一种信息搜索方法,其特征在于,所述方法包括:/n获取第一关键词;/n查询信息库获得与所述第一关键词满足相似度条件的第一信息;/n提取所述第一信息中的关键字段;/n将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;/n基于所述匹配结果,返回搜索结果。/n

【技术特征摘要】
1.一种信息搜索方法,其特征在于,所述方法包括:
获取第一关键词;
查询信息库获得与所述第一关键词满足相似度条件的第一信息;
提取所述第一信息中的关键字段;
将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;
基于所述匹配结果,返回搜索结果。


2.根据权利要求1所述的方法,其特征在于,所述查询信息库获得与所述第一关键词满足相似度条件的第一信息,包括:
将所述第一关键词与信息库的第二信息进行语义聚类,得到聚类结果;
基于所述聚类结果,从所述第二信息中选择出与所述第一关键词的语义满足相似度条件的第一信息。


3.根据权利要求2所述的方法,其特征在于,所述将所述第一关键词与所述信息库的第二信息进行语义聚类,得到聚类结果,包括:
将所述第一关键词转换第一语义向量;
将所述第一语义向量与所述第二信息的第二语义向量进行语义聚类,获得聚类结果;
所述基于所述聚类结果,从所述第二信息中选择出与所述第一关键词的语义满足相似度条件的第一信息,包括:
根据所述聚类结果,从所述第二语义向量中选择出与所述第一语义向量满足所述相似度条件的第三语义向量;
根据所述第三语义向量所对应的信息,确定与所述第一关键词满足相似度条件的第一信息。


4.根据权利要求1所述的方法,其特征在于,所述提取所述第一信息中的关键字段,包括:
将所述第一信息拆分成多个字段;
获取任意两个字段之间的语义相似度;
基于任意两个字段之间的语义相似度,确定所述语义相似度大于阈值的字段集;
根据所述字段集的字段数量,对所述字段集进行排序,得到第一排序结果;
根据所述第一排序结果,选出排在前预定位数上对应的字段集;
将选出的所述字段集对应的字段作为所述第一信息中的关键字段。


5.根据权利要求2所述的方法,其特征在于,所述将所述第一关键词与信息库的第二信息进行语义聚类,得到聚类结果,包括:
对所述第一关键词进行扩充处理,得到第二关键词;其中,所述对所述第一关键词进行扩充处理,...

【专利技术属性】
技术研发人员:陈敬杨希梁俊
申请(专利权)人:中移苏州软件技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1