数据搜索方法、系统及存储介质技术方案

技术编号:30798948 阅读:14 留言:0更新日期:2021-11-16 08:04
本申请为人工智能技术领域,本申请提供了一种数据搜索方法、系统及存储介质,其中,该方法包括:中转服务器获取用户的搜索请求,根据搜索请求确定用户的操作意向,根据操作意向查询搜索请求所需使用的分发服务器,从搜索请求提取搜索数据,将搜索数据发送至操作意向对应的分发服务器,分发服务器对搜索数据进行拆分,得到子搜索数据,并将各个子搜索数据分发给预设查询引擎,各个预设查询引擎从预设数据库中获取子搜索数据对应的目标数据;分发服务器对各目标数据合并后生成查询结果,中转服务器基于查询结果生成目标查询结果,将目标查询结果发送给用户。本申请基于不同的操作意向选择相应的分发服务器,避免大量的无效搜索,提高数据查询效率。高数据查询效率。高数据查询效率。

【技术实现步骤摘要】
数据搜索方法、系统及存储介质


[0001]本申请涉及人工智能
,具体而言,本申请涉及一种数据搜索方法、系统及存储介质。

技术介绍

[0002]在信息技术日益发达,企业生产数据日益庞大,知识爆炸性增长的今天,如何快速有效检索企业内部的运营数据,提升知识管理的效果,是每个企业不得不面对的一个现实问题。
[0003]目前常见的数据搜索技术为采用关系型数据库进行数据存储,对系统内关键数据检索通常是基于数据库部分字段的精确匹配及部分字段的模糊搜索,在数据量比较大时,这种搜索方式的搜索性能较差,搜索效率较低。

技术实现思路

[0004]本申请的主要目的为提供一种数据搜索方法、系统及存储介质,以提高数据搜索效率。
[0005]为了实现上述专利技术目的,本申请提供一种数据搜索方法,应用于数据搜索系统,所述数据搜索系统包括中转服务器、分发服务器及预设查询引擎,所述数据搜索方法包括:
[0006]所述中转服务器获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
[0007]所述分发服务器对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
[0008]各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;
[0009]所述分发服务器接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
[0010]所述中转服务器对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
[0011]优选地,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型,所述各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,包括:
[0012]各个所述预设查询引擎对所述子搜索数据进行特征提取,并转换为特征向量;
[0013]将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
[0014]优选地,所述子搜索数据为文本,所述各个所述预设查询引擎对所述子搜索数据进行特征提取,包括:
[0015]各个所述预设查询引擎对所述文本进行分词,得到分词结果;
[0016]对所述分词结果进行词性标注,得到标注结果;
[0017]根据所述标注结果确定所述文本的关键字,将所述关键字转换为字向量,得到所述特征向量。
[0018]进一步地,所述将所述特征向量输入所述自然语言处理模型中之前,还包括:
[0019]各个所述预设查询引擎获取样本数据,对所述样本数据进行特征抽取,形成样本特征向量;
[0020]将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练;
[0021]判断所述初始自然语言处理模型输出的训练结果是否满足要求;
[0022]若是,将训练结果满足要求的初始自然语言处理模型作为所述自然语言处理模型;
[0023]若否,根据所述训练结果调整所述初始自然语言处理模型的参数,并返回执行所述将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练的步骤,以对调整参数后的所述初始自然语言处理模型再次训练,直至所述初始自然语言处理模型输出的训练结果满足要求为止。
[0024]优选地,所述操作意向对应的分发服务器包括自助查询SQL服务,所述将所述搜索数据发送至所述操作意向对应的分发服务器,包括:
[0025]所述中转服务器判断所述搜索数据是否为SQL查询语句;
[0026]若是,则将所述搜索数据发送至自助查询SQL服务。
[0027]优选地,所述将所述目标查询结果发送给所述用户,包括:
[0028]所述中转服务器从所述搜索请求中确定所述用户的权限范围;
[0029]将所述目标查询结果中不属于所述权限范围内的数据删除,并将删除数据后的所述目标查询结果发送给所述用户。
[0030]优选地,所述将所述目标查询结果发送给所述用户,包括:
[0031]所述中转服务器将所述目标查询结果进行封装,并确定所述目标查询结果的数据类型;
[0032]将封装后的所述目标查询结果及数据类型发送至所述用户所在终端,以使所述终端解析所述目标查询结果后,按照所述数据类型进行展示。
[0033]本申请还提供一种数据搜索系统,其包括:
[0034]中转服务器,用于获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;
[0035]分发服务器,用于对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;
[0036]多个预设查询引擎,各个所述预设查询引擎用于基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务
器;
[0037]所述分发服务器还用于接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;
[0038]所述中转服务器还用于对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。
[0039]优选地,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型;其中,
[0040]各个所述预设查询引擎还用于对所述子搜索数据进行特征提取,并转换为特征向量,将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。
[0041]本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
[0042]本申请所提供的一种数据搜索方法、系统及存储介质,通过中转服务器获取用户的搜索请求,根据搜索请求确定用户的操作意向,根据操作意向查询搜索请求所需使用的分发服务器,然后从搜索请求提取搜索数据,将搜索数据发送至对应操作意向的分发服务器,分发服务器对搜索数据进行拆分,得到多个子搜索数据,并将各个子搜索数据分发给不同的预设查询引擎,预设查询引擎从预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据搜索方法,应用于数据搜索系统,所述数据搜索系统包括中转服务器、分发服务器及预设查询引擎,其特征在于,所述数据搜索方法包括:所述中转服务器获取用户的搜索请求,根据所述搜索请求确定所述用户的操作意向,根据所述操作意向查询所述搜索请求所需使用的分发服务器,并从所述搜索请求提取搜索数据,将所述搜索数据发送至所述操作意向对应的分发服务器;所述分发服务器对接收到的所述搜索数据进行拆分,得到多个子搜索数据,并将各个所述子搜索数据分发给不同的预设查询引擎;各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,将所述目标数据发送给所述分发服务器;所述分发服务器接收各个所述预设查询引擎发送的所述目标数据,将所有所述目标数据进行合并后生成查询结果,将所述查询结果发送给所述中转服务器;所述中转服务器对所述查询结果的所有字段进行敏感词过滤,并将含有敏感词的字段替换为无法识别的目标文本,生成目标查询结果,将所述目标查询结果发送给所述用户。2.根据权利要求1所述的方法,其特征在于,所述用户的操作意向包括对业务数据的查询,各个所述预设查询引擎配置有自然语言处理模型,所述各个所述预设查询引擎基于接收到的子搜索数据,从预设数据库中获取所述子搜索数据对应的目标数据,包括:各个所述预设查询引擎对所述子搜索数据进行特征提取,并转换为特征向量;将所述特征向量输入所述自然语言处理模型中,得到目标数据;其中,所述自然语言处理模型为预先训练好的神经网络模型,用于根据所述特征向量从预设数据库中获取目标数据。3.根据权利要求2所述的方法,其特征在于,所述子搜索数据为文本,所述各个所述预设查询引擎对所述子搜索数据进行特征提取,包括:各个所述预设查询引擎对所述文本进行分词,得到分词结果;对所述分词结果进行词性标注,得到标注结果;根据所述标注结果确定所述文本的关键字,将所述关键字转换为字向量,得到所述特征向量。4.根据权利要求2所述的方法,其特征在于,所述将所述特征向量输入所述自然语言处理模型中之前,还包括:各个所述预设查询引擎获取样本数据,对所述样本数据进行特征抽取,形成样本特征向量;将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练;判断所述初始自然语言处理模型输出的训练结果是否满足要求;若是,将训练结果满足要求的初始自然语言处理模型作为所述自然语言处理模型;若否,根据所述训练结果调整所述初始自然语言处理模型的参数,并返回执行所述将所述样本特征向量和期望的标准查询结果输入初始自然语言处理模型中进行训练的步骤,以对调整参数后的所述初始自然语言处理模型再次训练,直至所述初...

【专利技术属性】
技术研发人员:姚小丰
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1