一种数据检索方法、装置、设备以及存储介质制造方法及图纸

技术编号:35534721 阅读:19 留言:0更新日期:2022-11-09 15:00
本发明专利技术实施例提供了一种数据检索方法、装置、设备以及存储介质,涉及信息处理技术领域。具体实现方案为:响应于接收到针对指定资源类型的检索请求,确定所述检索请求所指示的目标检索词;获取预先构建的检索语句模板;利用预先构建的检索语句模板,生成以所述目标检索词作为所述待检索词的第一检索语句;从所述资源库中的所述指定资源类型的待检索资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源;基于所述各个目标资源,输出所述检索请求对应的检索结果。可见,通过本方案,可以在不依赖于更改ES引擎的配置文件的前提下,实现同时支持精准查询和模糊查询。实现同时支持精准查询和模糊查询。实现同时支持精准查询和模糊查询。

【技术实现步骤摘要】
一种数据检索方法、装置、设备以及存储介质


[0001]本专利技术涉及信息处理
,特别是涉及一种数据检索方法、装置、设备以及存储介质。

技术介绍

[0002]在大数据日益发展的趋势下,针对大数据的检索场景越来越多,ES(Elasticsearch,弹性搜索)引擎作为一种分布式、高扩展、高实时的搜索与数据分析引擎,广泛应用于各种大数据检索场景。
[0003]相关技术中,ES引擎的常用查询机制只支持精准查询或模糊查询,若需要利用ES引擎同时支持精准查询和模糊查询,需要修改ES引擎的配置文件中的mapping设置,将待检索的检索词同时映射成text(文本)或keyword(关键词)类型,实现同时支持精准查询和模糊查询。但是,这种方式需要开发人员充分掌握ES引擎的底层配置原理,对开发人员的要求较高,导致开发人员需要耗费大量的学习成本。
[0004]因此,亟需一种应用于ES引擎的数据检索方法,以在不依赖于更改ES引擎的配置文件的前提下,实现同时支持精准查询和模糊查询,成为亟需解决的技术问题。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种数据检索方法、装置、设备以及存储介质,以实现在不依赖于更改ES引擎的配置文件的前提下,实现同时支持精准查询和模糊查询。具体技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种数据检索方法,应用于弹性搜索ES引擎,所述ES引擎所操作的资源库中包括多种资源类型的资源,同一资源类型下的各个资源对应有相同的第一字段,每一资源对应的第一字段为用于描述该资源的字段;所述方法包括:
[0007]响应于接收到针对指定资源类型的检索请求,确定所述检索请求所指示的目标检索词;
[0008]获取预先构建的检索语句模板;其中,所述检索语句模板中至少包括以或的方式组合的第一匹配模式以及第二匹配模式;所述第一匹配模式为表征与待检索词的分词匹配的检索模式,所述第二匹配模式为表征至少与所述待检索词匹配的检索模式;
[0009]利用预先构建的检索语句模板,生成以所述目标检索词作为所述待检索词的第一检索语句;
[0010]从所述资源库中的所述指定资源类型的待检索资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源;
[0011]基于所述各个目标资源,输出所述检索请求对应的检索结果。
[0012]可选地,每一资源类型下的各个资源还对应至少一第二字段;其中,每一资源对应的第二字段为表征该资源的资源内容所属的内容类别的字段;所述检索语句模板中还包括表征与待筛选项精准匹配的第三匹配模式;
[0013]在所述响应于接收到针对指定资源类型的检索请求,确定所述检索请求所指示的目标检索词之后,所述方法还包括:
[0014]识别所述检索请求中是否携带有目标筛选项;其中,所述目标筛选项为一第二字段的字段值;
[0015]所述利用预先构建的检索语句模板,生成以所述目标检索词作为所述待检索词的第一检索语句,包括:
[0016]若所述检测请求中携带有目标筛选项,利用预先构建的检索语句模板中所包含的所述第一匹配模式以及所述第二匹配模式,生成以所述目标检索词作为所述待检索词的第一检索语句,以及,利用所述第三匹配模式,生成以所述目标筛选项作为所述待筛选项的第二检索语句;
[0017]相应的,所述从所述资源库中的所述指定资源类型的待检索资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源,包括:
[0018]从所述资源库中的指定资源类型的待检索资源中,检索所对应第二字段的字段值匹配所述第二检索语句的各个待利用资源;
[0019]从所述各个待利用资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源。
[0020]可选地,所述基于所述各个目标资源,输出所述检索请求对应的检索结果,包括:
[0021]针对所述各个目标资源中的每一资源,基于该资源对应的第一字段的字段值对应的命中程度,对该资源进行打分,得到打分分值;其中,每一字段值对应的命中程度表征该字段值命中所述目标检索词的字符数;
[0022]按照所述各个目标资源的打分分值的降序排序的方式,对所述各个目标资源进行排序;
[0023]将排序后的各个目标资源进行输出。
[0024]可选地,所述基于该资源对应的第一字段的字段值对应的命中程度,对该资源进行打分,得到打分分值,包括:
[0025]基于该资源对应的第一字段的字段值对应的命中程度,以及该资源的热度,对该资源进行打分,得到打分分值;其中,每一资源的热度表征该资源的使用价值。
[0026]可选地,所述第一字段为多个,每一第一字段对应有第一权重值;所述热度对应有第二权重值;
[0027]所述基于该资源对应的第一字段的字段值对应的命中程度,以及该资源的热度,对该资源进行打分,得到打分分值,包括:
[0028]基于该资源对应的每一第一字段的字段值对应的命中程度,分别对该资源进行打分,得到多个第一分值;
[0029]根据该资源的热度对该资源进行打分,得到第二分值;
[0030]基于各个第一字段对应的第一权重值以及所述热度对应的第二权重值,对所述第一分值和第二分值进行加权求和,得到该资源的打分分值。
[0031]第二方面,本专利技术实施例提供了一种数据检索装置,应用于弹性搜索ES引擎,所述ES引擎所操作的资源库中包括多种资源类型的资源,同一资源类型下的各个资源对应有相同的第一字段,每一资源对应的第一字段为用于描述该资源的字段;所述装置包括:
[0032]确定模块,用于响应于接收到针对指定资源类型的检索请求,确定所述检索请求所指示的目标检索词;获取预先构建的检索语句模板;其中,所述检索语句模板中至少包括以或的方式组合的第一匹配模式以及第二匹配模式;所述第一匹配模式为表征与待检索词的分词匹配的检索模式,所述第二匹配模式为表征至少与所述待检索词匹配的检索模式;
[0033]生成模块,用于利用预先构建的检索语句模板,生成以所述目标检索词作为所述待检索词的第一检索语句;
[0034]检索模块,用于从所述资源库中的所述指定资源类型的待检索资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源;
[0035]输出模块,用于基于所述各个目标资源,输出所述检索请求对应的检索结果。
[0036]可选地,每一资源类型下的各个资源还对应至少一第二字段;其中,每一资源对应的第二字段为表征该资源的资源内容所属的内容类别的字段;所述检索语句模板中还包括表征与待筛选项精准匹配的第三匹配模式;
[0037]所述装置还包括:
[0038]识别模块,用于在所述确定模块执行响应于接收到针对指定资源类型的检索请求,确定所述检索请求所指示的目标检索词的步骤之后,识别所述检索请求中是否携带有目标筛选项;其中,所述目标筛选项为一第二字段的字段值;
[0039]所述生成模块,具体用于:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据检索方法,其特征在于,应用于弹性搜索ES引擎,所述ES引擎所操作的资源库中包括多种资源类型的资源,同一资源类型下的各个资源对应有相同的第一字段,每一资源对应的第一字段为用于描述该资源的字段;所述方法包括:响应于接收到针对指定资源类型的检索请求,确定所述检索请求所指示的目标检索词;获取预先构建的检索语句模板;其中,所述检索语句模板中至少包括以或的方式组合的第一匹配模式以及第二匹配模式;所述第一匹配模式为表征与待检索词的分词匹配的检索模式,所述第二匹配模式为表征至少与所述待检索词匹配的检索模式;利用预先构建的检索语句模板,生成以所述目标检索词作为所述待检索词的第一检索语句;从所述资源库中的所述指定资源类型的待检索资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源;基于所述各个目标资源,输出所述检索请求对应的检索结果。2.根据权利要求1所述的方法,其特征在于,每一资源类型下的各个资源还对应至少一第二字段;其中,每一资源对应的第二字段为表征该资源的资源内容所属的内容类别的字段;所述检索语句模板中还包括表征与待筛选项精准匹配的第三匹配模式;在所述响应于接收到针对指定资源类型的检索请求,确定所述检索请求所指示的目标检索词之后,所述方法还包括:识别所述检索请求中是否携带有目标筛选项;其中,所述目标筛选项为一第二字段的字段值;所述利用预先构建的检索语句模板,生成以所述目标检索词作为所述待检索词的第一检索语句,包括:若所述检测请求中携带有目标筛选项,利用预先构建的检索语句模板中所包含的所述第一匹配模式以及所述第二匹配模式,生成以所述目标检索词作为所述待检索词的第一检索语句,以及,利用所述第三匹配模式,生成以所述目标筛选项作为所述待筛选项的第二检索语句;相应的,所述从所述资源库中的所述指定资源类型的待检索资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源,包括:从所述资源库中的指定资源类型的待检索资源中,检索所对应第二字段的字段值匹配所述第二检索语句的各个待利用资源;从所述各个待利用资源中,检索所对应第一字段的字段值匹配所述第一检索语句的各个目标资源。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述各个目标资源,输出所述检索请求对应的检索结果,包括:针对所述各个目标资源中的每一资源,基于该资源对应的第一字段的字段值对应的命中程度,对该资源进行打分,得到打分分值;其中,每一字段值对应的命中程度表征该字段值命中所述目标检索词的字符数;按照所述各个目标资源的打分分值的降序排序的方式,对所述各个目标资源进行排序;
将排序后的各个目标资源进行输出。4.根据权利要求3所述的方法,其特征在于,所述基于该资源对应的第一字段的字段值对应的命中程度,对该资源进行打分,得到打分分值,包括:基于该资源对应的第一字段的字段值对应的命中程度,以及该资源的热度,对该资源进行打分,得到打分分值;其中,每一资源的热度表征该资源的使用价值。5.根据权利要求4所述的方法,其特征在于,所述第一字段为多个,每一第一字段对应有第一权重值;所述热度对应有第二权重值;所述基于该资源对应的第一字段的字段值对应的命中程度,以及该资源的热度,对该资源进行打分,得到打分分值,包括:基于该资源对应的每一第一字段的字段值对应的命中程度,分别对该资源进行打分,得到多个第一分值;...

【专利技术属性】
技术研发人员:王双星马丽霞李海伟许哲孟祥凯张舒凯
申请(专利权)人:中信建投证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1